第 一 日 绪论 


1.1 集合 与 关系 


俗话 说 :“ 物 以 类 聚 ”。 世 界 上 万 事 万 物 ,大 至 宇宙 .星系 ,小 至 原 
子 、 电 子 , 在 物质 及 其 运动 的 各 个 层次 上 ,各 种 事物 无 一 不 可 分 门 别 
类 。 人们 把 同类 的 事物 放 在 一 起 考虑 ,就 组 成 了 所 谓 的 集合 。 在 我 们 
日 常生 活 中 ,集合 的 例子 比比 皆 是 。 例 如 ,，“ 太 阳 系 中 行星 的 全 体 ” 是 
一 个 集合 ;“ 某 所 学 校 所 有 在 校 学 生 ” 是 一 个 集合 。 总 之 , 当 某 些 具有 
共同 性 质 的 事物 汇合 在 一 起 ,就 形成 了 一 个 集合 。 z 


一 、 集 合 


1. 集合 的 概念 及 其 表示 法 

我 们 把 具有 某 种 共同 性 质 的 事物 的 全 体 称 为 集合 ,简称 集 。 组 成 
集合 的 每 个 事物 称 为 这 个 集合 的 元 素 。 习 惯 上 用 大 写字 母 A、B、… 
等 表示 集合 ,用 小 写字 母 a.b、… 等 表示 集合 的 元 素 。 当然, 在 一 些 特 
殊 集合 中 ,元 崇 往 往 有 既定 符号 。 在 本 日 中 ,自然 数 集 用 N 表示 ; 整 
数 集 用 Z 表示 ;有理 数 集 用 Q 表示 ;实数 集 用 R 表示 ;复数 集 用 C 表 
示 。 

奋 有 一 个 集合 A, 当 事物 a 是 A 中 的 一 个 元 素 时 ,就 称 a 属于 
A, 记 为 aEA; 当 事 物 a 不 是 A 中 的 一 个 元 素 时 ,就 称 a 不 属于 A， 
记 为 a 人 A。 例 如 :一 2€2, 一 2&NN。 

假定 一 个 集合 A 中 包含 n 个 元 素 a1,as，… ,as《n 记 = 二 0), 则 称 集 
合 A 是 一 个 有 限 集 , 记 为 A= {ai a2,""° ya 

例如 : 设 P 是 小 于 12 的 质数 集 。 因 为 P 的 元 素 为 2.3、5、7、11， 
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所 以 可 记 为 
(2 80.751L) 
集合 既然 是 由 具有 某 种 共同 性 质 的 事物 组 成 的 ,那么 用 这 种 性 
质 同样 也 能 限定 集合 由 哪些 元 素 组 成 。 这 样 就 得 到 了 集合 的 另 一 种 
表示 方法 ,其 一 般 形 式 如 下 : 
A= {x|P)} 
其 中 P 是 指 某 种 性 质 ,x|P 就 是 指 元 素 x 具有 性 质 P, 而 A= {x|P} 
则 表示 集合 A 是 由 所 有 具有 性 质 P 的 那些 x 组 成 的 。 
例如 :方程 x: 一 4x 十 3 二 0 的 解 集 S, 可 表示 成 
S= 二 {1,3; 或 S={x|x: 一 4x 十 3 二 0,xE RI 
当 集合 A 中 不 包含 任何 元 素 时 , 则 称 A 是 一 个 空 集 , 空 集 用 符 
号 下 表示 。 如 果 集 合 A 中 包含 的 元 素 是 无 限 的 , 则 集合 A 称 为 无 限 
集 ,在 今后 的 讨论 中 我 们 将 主要 是 在 有 限 集 上 进行 ,因此 如 果 未 作 说 
明 , 所 说 的 集合 都 是 指 有 限 集 。 
2. 集合 之 间 的 关系 和 运算 
(1) 集合 的 之 间 的 关系 z 
设 A 和 B 是 两 个 集合 ,如 果 A 的 每 
b 一 个 元 素 都 属于 集合 B, 则 称 集 合 B 包含 
.7 集合 A ,或 称 集 合 A 包含 于 集合 B， 记 为 
ACB。 这 时 也 把 集合 A 称 为 集合 B 的 子 
集 ,把 集合 B 称 为 集合 A 的 扩张 集 。 用 
a nn ( 文 民 ) 图 来 表示 ACB 是 非常 直观 
的 ,如 图 1-1 所 示 。 
如 果 集 合 A 是 集合 B 的 子 集 ,并 且 B 人 a 不 属 
于 A, 则 称 A 是 B 的 真子 集 。 
例如 : 设 集合 A 为 6 的 正 因数 集 ,B 为 12 的 正 因数 集 , 则 
Nt1233506)3 
B= {1,2,3,4,6,12) 
因为 集合 A 的 元 素 都 是 集合 B 的 元 素 , 所 以 ACB, 即 A 是 B 的 于 
集 , 旦 是 真子 集 。 
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如 果 给 定 两 个 集合 A 和 B, 它 们 满足 ACB 和 BCA, 则 称 集合 
A 和 了 相等 , 记 为 A=B。 也 就 是 说 两 个 集合 中 含有 相同 的 元 素 ( 次 
序 不 一 定 一 致 ) 。 | 


例如 :C= {2,3,1) .Dllis2.3) 
显然, 由 于 集合 C 中 的 元 素 和 集合 D 中 的 元 
素 相 同 , 即 C 一 D。 ， 
(2) 集合 之 间 的 运算 (a) 集合 的 并 (AUB) 


对 于 集合 A.B, 定 义 它 们 的 并 集 AUB、 
交集 A [|B 和 差 集 A 一 B 如 下 : 

(1) 给 定 两 个 集合 A、B, 由 集合 A 和 B 
中 的 所 有 元 素 构 成 的 集合 称 为 A 和 B 的 并  (b) 集合 的 交 (ANB) 


集 , 记 为 AUB。 图 1-2(a) 为 其 文 氏 图 表示 。 0 
(2). 给 定 两 个 集合 A.B, 由 同时 属于 集合 
A、B 的 所 有 元 素 构成 的 集合 称 为 A 和 B 的 交 pp 
集 , 记 为 AB。 图 1-2(b) 为 其 文 氏 图 表示 。 ”“” 针 全 的 差 (AB) 
(3) 给 定 两 个 集合 A、B, 由 所 有 属于 集合 
A 而 不 属于 集合 B 的 那些 元 素 构 成 的 集合 称 ”图 1"2 集合 的 运算 
为 A 和 B 的 差 集 , 记 为 A 一 B。 图 1-2(c) 为 其 文 氏 图 表示 。 
例如 :A 二 {1,2,3;4} ”B= {1,3,5,7) 
则 AUB={]1,2,3,4,5,7} 
ANMB= 1{1,3} 
A—B={2,4} 
如 果 集 合 A 和 B 满足 A 门 B= 二 @, 就 称 集合 A 和 B 是 不 相交 的 。 


按照 交集 的 定义 ,这 也 就 是 说 ,集合 A 和 B 没 有 公共 的 元 素 。 
二 、 关 系 


在 此 我 们 首先 介绍 有 序 对 ( 序 偶 ) 的 概念 。 在 初等 数学 中 ,最 常见 

最 典型 的 序 偶 ,就 是 平面 直角 坐标 系 中 点 的 坐标 (x,y)。 例 如 :点 (1， 

一 2)、 点 (一 3,5) 等 。 如 果 ai'az 是 两 个 元 素 , 按 先后 顺序 将 它们 排列 

在 一 起 ,并 且 作 为 一 个 整体 来 看 待 , 则 称 它 为 一 个 序 偶 , 记 为 (ai ,as)。 
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注意 (a1,as) 和 (as,al) 是 不 同 的 ,因为 它们 的 排列 顺序 不 同 。 例 如 ,在 
平面 直角 坐标 系 中 (1, 一 2) 和 (一 2,1) 是 不 同 的 ,它们 代表 两 个 不 同 
的 点 。 
如 果 给 定 两 个 集合 A 和 也 , 则 定义 它们 的 笛 卡 尔 积 如 下 , 记 为 A 
xPB, 
AXB={(a,b) | a€A,b€EP) 
例如 : 设 A={a,b},B 二 {1,2,3), 那 么 A 和 B 的 笛 卡 尔 积 为 : 
AxB={(a,1),(a,2),(a,3),(b,1),(b,2),(b,3)} 
BXA={(l,a),(l,b), (2,a), (2,b),(3,a) ,3,b))} 
一 般 地 ,对 于 任何 两 个 有 限 集 A 和 B 来 讲 , 如 果 A 有 n 个 元 素 ， 
B 有 m 个 元素, 那么 ,AXB 和 BXA 都 有 nXm 个 元 素 。 但 是 ,正如 
上 例 中 所 表明 的 ,AXB 和 BXA 的 元 素 个 数 虽 然 一 样 ,其 元 素 却 不 - 
同 ,它们 通常 是 两 个 不 同 的 集合 , 即 AXB 关 BXA, 在 AXB. 中 ,如 有 
B 和 A 相等 , 即 B= 二 A, 则 笛 卡 尔 积 自然 应 为 AXA。 
集合 AXB 的 每 个 子 集 R 都 称 为 从 A 到 B 的 一 个 关系 ,或 者 称 
R 是 AXB 的 -个 关系 , 当 A=B 时 ,就 称 R 是 定义 在 A 上 的 一 个 关 
系 。 如果 R 是 定义 在 集合 A 上 的 一 个 关系 , 则 (a,b) ER 时 ,就 称 元 
素 a 和 bb 有 关系 尺 , 记 作 aRb。 此 时 元 素 a 称 为 元 素 b 的 前 级 (或 前 
驱 ) ,元素 b 称 为 元 素 a 的 后 继 。 
设 R 是 非 空 集合 A 上 的 一 个 关系 ,如 果 对 于 A 中 的 任何 元 素 
a, 都 有 (a,a) ER, 则 称 关系 R 是 自 反 的 。 如 果 对 于 A 中 任何 元 素 a， 
都 没有 (a,a)€R, 则 称 关系 R 是 反 自 反 的 。 如 果 对 于 A 中 的 任何 元 
素 a 和 b, 当 (a,b)ER 时 , 必 有 (b,a) ER, 则 称 关 系 R 是 对 称 的 。 如 
果 (a,b) ER 是 (b,a)€ER 时 , 必 有 a==b, 则 称 R 是 反对 称 的 。 如 果 
对 于 A 中 的 任何 元 素 a、b.c, 当 (a,b)ER, 并 且 《b,c)ER, 必 有 (a,c) 
ER 时, 则 称 关 系 R 是 传递 的 。 
例如 :整数 集 Z 上 的 关系 “二 ”是 自 反 的 ,因为 对 于 任意 xEZ， 
总 有 x 二 x; 而 整数 集 Z 上 的 关系 “4” 是 反 自 反 的 。 因 为 对 于 任何 x€ 
Z, x(x 都 不 成 立 。 整 数 集 Z 上 的 关系 “= ?是 对 称 的 ,而 关系 之、 
“二 ” “过 ”“<” 是 反对 称 的 。 整 数 集 2 上 的 关系 “过 ”是 传递 的 ， 因 
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为 对 于 任何 abcEZ, 如 果 a<<b 且 b<c, 则 必 有 a<<c。 

当 集 合 A 上 定义 的 关系 及 是 自 反 的 、 对 称 的 和 传递 的 ,这 时 就 
称 R 是 一 个 等 价 关 系 。 此 时 ,如 果 (a,b) ER, 就 称 元 素 a 和 b 是 等 价 
的 。 例 如 ,整数 集 Z 上 的 关系 “= ”是 一 个 等 价 关系 。 

当 集 合 A 上 定义 了 一 个 等 价 关 系 R 时 ,可 以 根据 这 个 关系 将 A 
中 的 元 素 分 成 若干 部 分 ,让 它们 分 别 属于 A 的 若干 个 子 集 , 这 些 子 
集 互 不 相交 ,并 且 使 同一 个 子 集 的 任何 两 个 元 素 都 具有 关系 下， 而 
任何 两 个 子 集 中 的 任何 两 个 元 素 ,都 不 满足 关系 RR, 即 这 些 子 集 构成 
了 集合 A 的 一 些 划分 ,而 这 些 子 集 都 称 为 关系 R 的 等 价 类 。 

当 集 合 A 上 定义 的 关系 R 是 自 反 的 、 反 对称 的 和 传递 的 , 则 称 
R 是 集合 A 4 的 一 个 部 分 序 ( 或 偏 序 ) 关 系 。 如 果 在 集合 A 上 定义 了 
一 个 偏 序 关 系 人, 则 称 集合 A 为 偏 序 集 , 记 为 (A,R)。 显 然 ,对 于 一 
个 有 限 偏 序 集 来 说 ,至 少 有 一 个 元 素 没有 前 级 ,至 少 有 一 个 元 素 没 有 
后 继 。 例 如 ;自然 数 集 N、 整 数 集 Z、 有 理 数 集 Q 和 实数 集 R 上 的 关 
系 “ 魏 ”就 是 - -个 偏 序 关系 。 又 如 :在 自然 数 集 N 上 定义 关系 “/” 如 
下 ; 《x,y)€E/ 当 且 仅 当 x 整除 y。 不 难 证 明 ,/ 是 自然 数 集 N 上 的 一 个 
偏 序 关 系 。 

如 果 R 是 定义 在 集合 A 上 的 偏 序 关 系 , 即 (A,R) 是 一 个 偏 序 
集 ,并 且 关 系 R 满足 下 面条 件 :对 于 A 中 的 任何 元 素 a、b, (a,b) ER 
和 4b,a) ER 两 者 至 少 有 一 个 成 立 , 这 时 就 称 R 是 集合 A 上 的 一 个 
序 ( 或 完全 序 ) 关 系 ,A 在 这 个 序 关系 下 称 为 有 序 ( 或 完全 序 ) 集 , 仍 记 
为 (A,R)。 例 如 :自然 数 集 N、 整 数 集 Z. 有 理 数 集 Q 和 实数 集 R 在 
关系 “ 魏 ” 下 都 是 完全 序 集 。 而 自然 数 集 N 在 如 上 定义 的 关系 “/” 下 
就 不 是 完全 序 集 。 


1.2 数据 结构 概念 


“数据 结构 ?是 一 门 随 着 计算 机 科学 的 发 展 而 逐渐 形成 的 学 科 ， 

自 1946 年 美国 宾夕法尼亚 大 学 的 工程 师 和 科学 家 发 明了 第 一 台电 

子 计算 机 以 来 ,计算 机 科学 经 历 了 将 近 半 个 世纪 的 莲 勃 发 展 ,其 发 展 
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速度 远 远 超 出 了 和 人们 的 预料 ,可 谓 日 新 月 异 。 计 算 机 硬件 技术 ,软件 

技术 不 断 提高 ,使 计算 机 价格 越 来 越 便宜 ,功能 越 来 越 强大 ,也 就 使 
得 其 应 用 领域 越 来 越 广泛 .计算 机 的 应 用 早已 不 再 局 限于 科学 计算 ， 
而 更 多 地 用 于 过 程控 制 、. 数 据 处 理 、 信 息 管理 ,以 及 计算 机 辅助 设计 
(CAD) 和 计算 机 辅助 制造 (CAM) 等 非 数 值 数 据 的 处 理工 作 。 与 此 
相应 ， 计 算 机 加 工 处 理 的 对 象 一 一 数据 也 从 单纯 的 数值 数据 发 展 到 
字符 表格 .图 像 以 及 声音 等 各 种 非 数 值 数据 。 为 了 更 有 效 地 使 用 计 
算 机 ,设计 出 高 效 . 可 靠 的 程序 ,需要 对 数据 的 组 织 .数据 元 素 之 间 的 
关系 .数据 在 计算 机 中 的 表示 (包括 数据 元 素 的 表示 和 数据 元 素 之 间 
关系 的 表示 ) 以 及 对 数据 的 操作 进行 深入 研究 。 这 样 ， 就 促进 数据 
结构 "这 门 学 科 的 形成 和 发 展 。 


一 、 付 么 是 数据 结构 


在 介绍 数据 结构 这 一 概念 之 前 ,首先 要 了 解 一 下 数据 的 福 念 所 
谓 数据 就 是 指 对 客观 事物 的 符号 表示 。 在 计算 机 科学 中 我 们 把 所 有 
能 输入 到 计算 机 中 ,并 能 被 计算 机 处 理 的 符号 总 称 为 数据 。 换 言 之 ， 
它 就 是 计算 机 程序 加 工 的 原料 。 例 如 ,一 个 代数 方程 求解 程序 , 它 处 
理 的 对 象 (数据 ) 就 是 实数 ;又 如 :一 个 文字 处 理 程序 (如 WPS), 其 
处 理 的 对 象 就 是 字符 文字 。 对 于 计算 机 科学 而 言 , 数 据 的 含义 极其 广 
泛 ,图 像 .声音 等 都 可 以 通过 编码 而 归 之 为 数据 的 范畴 。 数 据 由 数据 
元 素 组 成 ,数据 元 素 是 数据 的 基本 单位 ,通常 在 计算 机 程序 中 作为 一 
个 整体 进行 考虑 和 处 理 , 而 数据 元 素 之 间 往 往 又 不 是 孤立 无 关 的 , 数 
据 结构 就 是 相互 之 间 存在 一 种 或 多 种 特定 关系 的 数据 元 素 的 集合 ， 
数据 元 素 之 间 存 在 的 相互 关系 就 叫 结构 。 根 据 数据 元 素 之 间 关 系 的 
不 同 特性 ,通常 有 下 列 四 类 基本 结构 ， 

1. 集合 :结构 中 的 数据 元 素 之 间 除 了 “同属 于 一 个 集合 ”的 关系 
外 , 别 无 其 它 关系 ， 

2. 线性 结构 :结构 中 的 数据 元 素 之 间 存 在 一 个 对 一 个 的 关系 ; 

3. 树 形 结构 :结构 中 的 数据 元 素 之 间 存 在 一 个 对 多 个 的 关系 ; 

4. 图 状 结构 (网 状 结构 ) :结构 中 的 数据 元 素 之 间 存 在 多 个 对 多 
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个 的 关系 。 
图 1-3 为 上 述 四 类 基本 结构 的 关系 图 。 其 中 ,圆圈 表示 数据 元 
素 , 圆圈 之 间 的 连 线 表示 数据 元 素 之 间 的 关系 。 在 本 书 中 将 主要 讨 
论 线性 结构 、 树 形 结构 和 网 状 结构 。“ 和 集合 ”, 由 于 元 素 之 间 的 关系 极 
为 松散 ,所 以 不 作 讨 论 。 
OO 


(a) 集合 (b) 线性 


《c) 树 (d) 图 


图 1-3 四 类 基本 结构 关系 图 
数据 结构 的 形式 定义 可 以 用 一 个 二 元 组 表示 : 

Data— Structure=: (D,R) 
其 中 ,D 为 具有 相同 特性 的 数据 元 素 的 有 限 集 ,R 是 D 上 数据 元 素 
之 间 关 系 的 有 限 集 。 例 如 : 复数 在 计算 机 科学 中 可 作 如 下 定义 : 

Complex= (C,R) z 
其 中 ,C= 二 {ciycz|ciycsE 实 数 },R= 二 {ci,cs)|ci 为 实 部 ,cs 为 虚 部 )。 
又 如 : 今 欲 编制 一 个 企业 管理 程序 , 其 中 需要 管理 工厂 中 各 车 间 的 
工人 , 则 首先 要 为 计算 机 处 理 的 对 象 一 一 车 间 工 人 设计 一 个 数据 结 
构 , 设 一 个 车 间 由 一 个 车 间 主 任 , 三 个 班组 的 小 组 长 以 及 12 个 工人 
组 成 , 且 这 些 成 员 之 间 的 关系 为 :车 间 主 任 负责 管理 三 个 小 组 长 ,一 
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小 组 长 二 音 理 四 个 工人 , 则 可 以 如 下 定义 数据 结构 
Grop= {P,R) 
其 中 ， P= ( 工 ,G Ga Gs, Wi ， Wi，Wa4/ 
R= (Ri,R;} 
R=:{(T,Gi) |1 志 3} 
Rs=((Gi, Wi) |l<i<3,1<<4) 

上 述 数据 结构 的 定义 仅 是 对 操作 对 象 的 一 种 数学 描述 ,而 没有 
对 操作 对 象 定义 具体 的 操作 , 换 句 话 说 , 即 从 操作 对 象 抽象 出 的 数学 
模型 .结构 定义 中 的 “关系 ”描述 的 是 数据 元 素 之 间 的 逻辑 关系 ,又 称 
逻辑 结构 。 

对 数据 结构 的 讨论 ,最 终 是 为 了 在 计算 机 中 实现 对 数据 元 素 的 
操作 .为 此 我 们 不 仅 要 讨论 数据 的 逻辑 结构 及 其 运算 ,而且 还 要 讨论 
数据 结构 在 计算 机 中 表示 一 一 数据 的 物理 结构 (又 称 存储 结构 ), 它 
包括 数据 元 素 的 表示 和 元 素 之 间 关 系 的 表示 。 数 据 元 素 之 间 关 系 的 
表示 有 两 种 不 同 的 方法 :顺序 映 象 和 非 顺 序 映 象 。 由 此 可 得 到 两 种 不 
同 的 存储 结构 :顺序 存储 结构 和 链 式 存 储 结 构 ( 非 顺序 存储 结构 ) 。 其 
中 ,顺序 存储 映 象 是 借助 元 素 在 存储 器 中 的 相对 位 置 来 表示 数据 元 
素 之 间 的 逻辑 关系 ; 非 顺 序 存 储 映 象 是 借助 在 一 个 数据 元 素 (a) 中 保 
存 另 一 数据 元 素 (b) 在 存储 器 中 的 相对 位 置 来 表示 两 个 元 素 (a 和 b) 
之 间 的 逻辑 关系 。 

程序 设计 语言 中 ,我 们 可 以 借助 “数据 类 型 ”来 描述 数据 的 存储 
结构 ,例如 ;在 PASCAL 语言 中 ,可 以 用 “一 维 数组 ”描述 顺序 存储 结 
构 ; 用 “指针 ”描述 链 式 存储 结构 。 

数据 类 型 在 程序 设计 语言 中 用 以 描述 (程序 ) 操 作对 象 的 特性 。 
”在 高 级 语言 中 ,每 个 变量 都 要 属于 一 个 确定 的 数据 类 型 ( 整 型 、 实 型 、 
字符 型 ,布尔 型 等 ) ,不 同 的 数据 类 型 规定 了 在 程序 执行 期 间 不 同 的 
变量 的 取 值 范围 和 人 允许 的 操作 ,所 以 ,数据 类 型 是 一 个 值 的 集合 和 定 
义 在 这 个 值 集 上 的 一 组 操作 的 总 称 。 例 如 ,在 PASCAL 语言 中 的 整 . 
数 类 型 , 它 定 义 了 其 值 集 为 区 间 [ 一 maxin…maxin] 上 的 整数 (maxin 
是 依赖 于 具体 计算 机 的 最 大 整数 ) ,并 规定 了 在 这 个 值 集 上 的 一 组 操 
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作为 :十 .一 、x*、 /DIV MOD 等 。 

与 数据 类 型 相关 的 还 有 一 个 概念 称 为 数据 对 象 。 数 据 对 象 是 某 
种 数据 元 素 的 集合 ,是 数据 的 一 个 子 集 .例如 PASCAL 语言 中 ,布尔 
类 型 的 数据 对 象 是 集合 {TRUE( 真 ),FALSE( 假 )} ,字符 的 数据 对 
象 为 集合 {x|xE€ 所 有 ASCII 字符 }。 


二 、 数 据 结构 的 发 展 概 况 


六 十 年 代 初 期 ,国内 外 的 大 学 中 都 没有 独立 的 “数据 结构 ”课程 ， 
但 数据 结构 的 有 关内 容 已 散 见于 操作 系统 、 编 译 原理 和 表 处 理 语言 
等 课程 之 中 。1968 年 ,美国 一 些 大 学 的 计算 机 科学 系 的 教学 计划 中 
明确 规定 “数据 结构 ”为 一 门 课程 ,但 没有 明确 规定 该 课程 的 内 容 范 
围 。 当 时 ,数据 结构 几乎 和 图 论 ,特别 是 表 和 树 的 理论 是 同 义 语 。 随 
后 ,数据 结构 这 个 概念 被 扩充 到 包括 网 络 、 代 数 、 集 合 论 .关系 等 现在 
称 之 为 “离散 数学 结构 ”的 那些 内 容 , 它 们 同 现在 的 “数据 结构 ”的 某 
些 内 容 混在 一 起 ,总 称 为 “数据 结构 ”。 由 于 数据 必须 在 计算 机 中 进行 
处 理 , 因 此 ,不 能 局 限于 研究 数据 本 身 的 数学 概念 ,还 必须 考虑 数据 
的 物理 结构 。 这 就 进一步 扩大 了 数据 结构 的 内 容 。 自 从 1968 年 美国 
研究 计算 机 科学 的 著名 教授 D. E. Knuth 所 著 的 “计算 机 程序 设计 技 
巧 ”《The Art of Computer Programming) 问 志 以 后 , 才 逐 渐 把 数据 的 
逻辑 结构 ,物理 结构 以 及 每 种 结构 所 定义 的 运算 作为 组 成 “数据 结 
构 ” 课 程 的 主要 内 容 。 近 年 来 ,由 于 数据 库 系统 的 不 断 发 展 ,在 数据 结 
构 课 程 中 又 增加 了 文件 管理 ,特别 是 大 型 文件 的 组 织 等 方面 的 内 容 。 

数据 结构 与 数学 .计算 机 硬件 .特别 是 计算 机 软件 有 着 密切 的 关 
系 。 它 是 计算 机 专业 的 一 门 核心 课程 ,是 编译 原理 、 操 作 系统 、 数 据 
库 、 人 工 智能 等 课程 的 基础 ,同时 又 广泛 用 于 信息 科学 、 系 统 工程 .应 
用 数学 以 及 各 种 工程 技术 领域 。 

数据 结构 在 计算 机 科学 中 有 着 十 分 重要 的 地 位 。 它 有 自己 的 理 
论 、 研 究 对 象 和 应 用 范围 ,而 且 其 研究 的 内 容 正在 不 断 扩充 和 深化 。 
而 作为 一 门 课程 .一 本 教材 , 因 受 特定 的 对 象 和 时 期 的 限制 ,因此 不 
能 全 面 地 反映 数据 结构 的 全 貌 ,但 值得 注意 的 是 ,数据 结构 是 新 兴 的 
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学 科 ,正信 方兴未艾 , 攻 勃 发 展 的 阶段 .一 方面 ,面向 各 专门 领域 中 特 
殊 问题 的 数据 结构 得 到 研究 积 发展, 如 多 维 图 形 数据 结构 等 ; 另 一 方 
面 ,从 抽象 数据 类 型 的 观点 来 讨论 数据 结构 ,已 成 为 一 种 新 的 趋势 ， 
越 来 越 被 人 们 所 重视 。 


习 是 


. 指出 下 列 集合 的 元 素 是 什么 ? 


(1) 我 国 四 大 发 明 的 集合 。 

(2) 小 于 24 并 且 是 5 的 倍数 。 

(3) B={w | Iw|=3, wE2). 

(4) 方程 y: 一 5y 十 4=0 在 实数 范围 内 的 解 。 


. 下 列 每 一 对 集合 是 否 相 等 ? 


(和 

(2) {1,2,3) , {2,1,4} 

(3) {a,b,c} , (b,c,d,e,a) 

(4) {x | x:—4x++3=0, xER} , {1,3} 


. 符 集 合 A={(a'byc}， 下 面 的 记 法 哪些 是 正确 的 ? 哪些 是 不 


正确 的 ? 
a€ Ai bCA ; (clICA ;ACA ; BCOCA ,; {ci}EA ; PEA 


。 已 知 : A={0,2,4,6,8}, B= ly D7590)y C=(2,5;6,9., 


求 : / 
AmnB,Anc,Bnc,AUB,AUC,BUC,A-B,B-C,C-A 


. 设 A={2,3,4,6}.B 一 {a,b,c), 求 AXB 和 BxXA。 
. 简 述 下 列 术语 :数据 数据 元 素 、 数 据 对 象 .数据 结构 、 存 储 结 


构 和 数据 类 型 。 


,数据 结构 研究 的 主要 内 容 是 什么 ? 
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第 二 日 ”算法 的 描述 与 分 析 


数据 结构 是 一 门 实践 性 很 强 的 学 科 , 通 过 该 课程 的 学 习 , 读 者 能 
运用 数据 结构 的 技巧 更 好 地 进行 算法 和 程序 设计 ,所 以 我 们 在 讨论 
各 种 数据 结构 的 基本 运算 时 ,都 给 出 了 相应 的 算法 。 对 于 算法 的 描 
述 , 我 们 力求 做 到 通俗 易 懂 , 适 于 自学 ,所 以 采用 文字 框图 进行 描述 。 
读者 在 掌握 和 理解 了 框图 所 示 的 设计 思想 后 ,可 以 较 方 便 地 使 用 目 
己 熟 悉 的 算法 语言 来 编制 程序 。 另 外 ,考虑 用 PASCAL 语言 来 编号 
程序 可 以 较 好 地 体现 程序 的 结构 ,并 且 简 明 易 学 ,具有 实用 价值 ,所 
以 本 书 中 大 部 分 算法 在 给 出 文字 框图 的 同时 还 给 出 了 用 PASCAL 
语言 编写 的 源 程 序 片断 。 下 面 , 我 们 将 对 本 书 框图 中 使 用 的 符号 及 
PASCAL 语言 进行 介绍 。 


2.1 PASCAL 语言 初步 


一 、 程 序 结 构 


首先 我 们 看 一 个 PASCAL 语言 程序 的 例子 ,该 程序 要 求 : 输 入 
两 个 数 ,并 且 计 算 两 数 之 和 ,然后 再 输出 结果 。 
PROGRAM example (INPUT ,OUTPUT); 
{This is used for s 一 X 十 y} 
VAR x,y,s:ingeger; 
BEGIN 
read (x,y); 
s: 一 X 十 yj 
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writeln(’s= ,8s) 
END. 

以 上 是 一 个 用 PASCAL 语言 编写 的 简单 程序 , 它 体 现 了 PAS- 
CAL 语言 程序 的 结构 由 程序 首部 和 分 程序 组 成 ,而 分 程序 又 分 为 说 
明 部 分 和 语句 部 分 。 

1. 程序 首部 

程序 首部 用 于 指定 程序 的 名 字 和 列 出 程序 中 用 到 的 文件 。 它 由 
程序 标识 符 、 程 序 名 、 程 序 参 数 所 组 成 。 其 中 ,程序 标识 符 是 PAS- 
CAL 语言 的 标志 ,是 每 个 PASCAL 语言 程序 都 有 的 ,用 PROGRAM 
表示 。 程序 名 事实 上 是 一 个 标识 符 , 是 用 户 为 程序 安排 的 名 字 ,就 像 
一 个 人 有 一 个 人 名 一 样 ,每 个 程序 都 有 一 个 程序 名 为 标记 。 如 上 例 
中 的 example 就 是 一 个 程序 名 。 在 PASCAL 语言 中 ,标识 符 是 一 个 
字母 开头 的 后 跟 若干 字母 或 数字 的 字符 串 。 例 如 :x,xl2,x3yz 等 都 
是 标识 符 ,而 123x 就 不 是 标识 符 。 程 序 参数 用 来 表示 该 程序 同 外 界 
的 联系 ,它们 一 般 是 文件 名 ,最 常用 的 文件 为 INPUT、OUTPUT, 表 
示 标 准 的 输入 /输出 文件 。 

程序 首部 有 时 还 带 有 程序 的 注释 部 分 ,用 于 对 程序 的 名 称 、 类 
型 功能、 编写 日 期 等 进行 描述 。 如 上 例 中 的 {This is used for s 二 x 十 
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2. 程序 的 说 明 部 分 

在 PASCAL 程序 中 允许 用 户 自己 定义 标号 .常量 、 类 型 变量 、 
过 程 和 函数 等 ,这些 都 必须 首先 在 程序 的 说 明 部 分 加 以 说 明 , 然 后 才 
能 在 程序 的 执行 部 分 引用 。 程 序 的 说 明 部 分 应 遵循 如 下 次 序 : 

(1) 标 号 说 明 部 分 ; 

(2) 常 量 定 义 部 分 ; 

《3) 类 型 定义 部 分 ; 

(4) 变 量 说 明 部 分 ; 

(5) 过 程 与 图 数 说 明 部 分 。 

下 面 予 以 逐一 介绍 。 
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加 标号 说 明 部 分 

在 PASCAL 语言 中 提供 了 GOTO 语句 。GOTO 语句 使 程序 不 
再 顺序 地 执行 程序 的 下 一 个 语句 , 而 转 去 从 指定 标号 的 语句 开始 执 
行 。 标 号 规定 为 四 位 以 内 的 无 符号 整数 ,标号 和 冒号 “: ”一 起 放 在 一 
个 语句 的 前 面 ,构成 一 个 带 标号 的 语句 。 例 如 : 

99,. Writeln( ERROR DETECTED ) ; 
GOTO 语句 的 例子 为 : GOTO 99 : 

PASCAL 语言 规定 ,语句 前 的 标号 以 及 GOTO 语句 的 标号 都 必 
须 在 标号 说 明 部 分 中 说 明 。 标 号 说 明 的 一 般 形 式 为 : 

LABEL 标号 表 ; 
其 中 ,标号 表 由 一 系列 标号 组 成 ,标号 之 间 用 逗号 隔 开 。 例 如 : 

LABEL 12 ,100; 
说 明了 两 个 标号 12 和 100。 

图 常量 定义 部 分 

在 程序 中 我 们 常会 用 到 一 些 具体 不 变 的 数据 , 称 为 常量 。 例 如 ， 
数学 常数 x 的 近似 值 3. 1415926。 在 程序 中 允许 在 哪里 用 到 一 个 常 
量 , 就 在 那里 写 出 这 个 常量 的 值 。 但 是 ,为 了 程序 描述 清晰 ,书写 方 
便 , 修 改 容易 ,程序 员 宁 愿 在 用 到 常量 的 地 方 使 用 一 个 标识 符 代替 常 
量 的 值 ,常量 定义 就 是 用 来 引入 一 个 标识 符 作 为 一 个 常量 的 同义词 。 
几 是 在 程序 中 出 现 这 个 标识 符 , 就 等 价 于 在 那里 直接 写 上 相应 的 常 
量 值 。 如 果 要 修改 某 一 常量 ,只 要 修改 一 下 它 的 常量 定义 即 可 。 常量 
定义 的 一 般 形 式 为 ， 

CONST 标识 符 1 二 常量 值 1; 

标识 符 2 二 常量 值 2; 


标识 符 n 王 常量 值 n; 
下 面 是 一 个 常量 定义 的 实例 , 它 定 义 了 三 个 常量 :Pi、Epsilon .Max : 
CONST Pi=3. 1415926 ; 
Epsilon=1E—6; 
Max = 100; 
ws 


于 类 型 定义 部 分 
PASCAL 语言 的 数据 类 型 可 以 图 示 如 下 : 
整数 类 型 (integer) 
标准 类 型 实数 关 型 (real) 


字符 类 型 (char) 
简单 类 型 布尔 类 型 (boolean) 


z | 枚 举 类 型 
数据 类 型 用 户 自 定义 类 型 { 于 界 半 
集合 类 型 
数组 类 型 
交 造 类 型 类 
文件 类 型 
指针 类 型 


对 四 种 标准 类 型 ,程序 员 不 用 预先 定义 就 可 以 引用 。 此外, 程序 
员 也 能 根据 需要 目 己 定义 类 型 ,并 给 一 个 类 型 标识 符 。 类 型 定义 的 一 
般 形式 为 ; 
TYPE 类 型 标识 符 1 二 类 型 1; 
类 型 标识 符 2 一 类 型 2; 


类 型 标识 符 n 一 类 型 n; 

其 中 ,类 型 标识 符 是 指 所 定义 类 型 的 名 称 , 类 型 指 已 定义 的 各 类 
型 ,具体 定义 后 面 介绍 。 

图 变量 说 明 部 分 

在 程序 中 除了 常量 外 还 经 常会 用 到 另外 一 种 数据 , 它 的 值 在 程 
序 执行 期 间 可 以 根据 需要 而 变化 ,我 们 称 之 为 变量 。 每 个 变量 必须 有 
一 个 标识 符 , 并 属于 某 一 类 型 .变量 说 明 就 是 把 变量 标识 符 和 它 的 类 
型 联系 起 来 。 变 量 说 明 的 形式 为 : 

VAR 标识 符 表 1: 类 型 名 1; 
标识 符 表 2: 类 型 名 2; 
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标识 符 表 n: 类 型 名 n; 
其 中 ,标识 符 表 由 一 个 或 多 个 标识 符 组 成 ,标识 符 之 间 用 逗号 分 隔 。 
例如 : 
VAR i,index ;integer; 
rootl ,root2 ;real; 
ch :char ; 
found ,boolean ; 
在 这 个 例子 中 ,把 i,index 说 明成 整 型 变量 ;rootl,root2 说 明成 实 型 
变量 ;ch 说 明成 字符 型 变量 ;found 说 明成 布尔 型 变量 。 
十 过 程 和 函数 定义 部 分 
在 PASCAL 语言 中 ,不 严格 地 说 ,过 程 ( 或 函数 ) 说 明 是 定义 了 
逻辑 上 相关 的 语句 序列 ,用 于 描述 一 组 复合 的 动作 。 并 且 给 这 个 语句 
序列 取 一 个 名 字 , 即 过 程 (或 函数 ) 名 .过 程 ( 或 函数 ) 定 义 的 结构 和 程 
序 类 似 。 
如 下 是 一 个 过 程 定义 的 例子 
. PROCEDURE add(x,y:integer; VAR sum.:integer); 
BEGIN 
sum : 一 X 十 y; 
END:; 
它 体现 了 PASCAL 语言 中 过 程 定义 的 结构 由 过 程 首部 和 分 程 
序 组 成 。 其 中 分 程序 的 定义 和 程序 中 的 分 程序 一 样 分 为 说 明 部 分 和 
语句 部 分 .过 程 首 部 用 于 指定 过 程 的 名 字 和 列 出 过 程 中 用 到 的 参数 ， 
它 由 过 程 标识 符 . 过 程 名 .形式 参数 所 组 成 。 其 中 ,过 程 标识 符 为 
PROCEDURE ,是 每 个 过 程 都 有 的 ;过 程 名 是 一 个 标识 符 , 是 用 户 为 
过 程 起 的 名 字 , 上 例 中 的 add 就 是 一 个 过 程 名 ;形式 参数 用 来 表示 该 
过 程 同 外 界 的 联系 ,上 例 中 定义 了 三 个 参数 x、y 和 sum ， 它 们 都 为 
” 整 型 数 , 其 中 ,x 和 y 称 为 值 参 , 它 只 能 从 外 界 把 数据 送 进来 , 而 不 能 
把 数据 送出 去 ;sum 称 为 变 参 , 它 不 仅 可 从 外 界 把 数据 送 进来 , 而 且 
通过 它 能 把 数据 送出 去 。. 
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下 面 是 一 个 函数 定义 的 例子 
FUNCTION eqCxyy:integer) :boolean; 
BEGIN 
IF x=y then return TRUE 
ELSE return FALSE 
END; 
哨 数 的 结构 和 过 程 类 似 也 由 函数 首部 和 分 程序 组 成 。 其 中 分 程 
序 的 定义 和 程序 中 的 分 程序 一 样 又 分 为 说 明 部 分 和 语句 部 分 。 函 数 
自 部 同 过 程 首部 不 同 之 处 在 于 函数 的 标识 符 是 FUNCTION ;并且 
盟 数 需要 指明 返回 值 的 类 型 。 上 例 中 函数 eq 返回 值 为 布尔 类 型 。 在 
果 数 中 要 使 用 return 语句 返回 函数 值 。 


二 、PASCAL 语言 的 语句 


PASCAL 程序 的 语句 部 分 由 如 下 形式 定义 : 
BEGIN 

语句 1; 

语句 2; 


语句 ni 

END 
其 中 ,语句 是 指 如 下 所 述 的 执行 性 语句 。 
1. 赋值 语句 

一 般 形 式 : 

变量 := 表达 式 ， 
其 作用 就 是 计算 右 端的 表达 式 , 并 把 结果 赋 给 左 端的 变量 。 其 中 表达 
式 可 以 是 算术 表达 式 、 关 系 表 达 式 和 布尔 表达 式 。 

PASCAL 语言 的 算术 表达 式 是 整 型 量 或 实 型 量 与 算术 运算 符 
的 合法 组 合 。 其 中 算术 运算 符 为 ; 

十 (加 )、 一 ( 减 )、x( 乘 ).DIV (整除 )、MOD( 求 余 )、/( 实 数 除 )。 

它 的 规定 如 下 : 
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(1) 十 (加 )、 一 ( 减 )、x* ( 乘 ) 是 三 种 常用 的 运算 , 当 两 个 操作 数 
都 是 整 型 数 时 ,运算 结果 是 整 型 数 ;其 中 , 若 有 一 个 实数 或 两 个 都 是 
实数 , 则 结果 为 实数 。 

(2) /( 实 数 除 ) 不 管 操作 数 是 实数 还 是 整数 ,结果 均 为 实数 。 
DIV (整数 除 ) 和 MOD( 求 余 ) 运 算 的 两 个 操作 数 必须 都 是 整 型 数 , 结 
果 也 是 整数 。 

PASCAL 语言 的 关系 表达 式 是 算术 表达 式 与 关系 运算 符 的 合 
法 组 合 。 关 系 运 算 符 主 要 有 下 列 六 种 ， 

二 (等 于 ) ,( (不 等 于 ),<<( 小 于 ),>( 大 于 ), 扫 一 (小 于 等 
于 ),>==( 大 于 等 于 ) 关 系 运算 的 结果 为 布尔 型 数值 : 真 (TRUE) 值 
和 假 (FALSE) 值 。 一 个 关系 表达 式 实际 上 表示 了 一 个 判定 条 件 , 若 
判定 条 件 满足 , 则 关系 表达 式 的 结果 为 TRUE ,否则 为 FALSE。 

PASCLA 语言 的 布尔 表达 式 是 由 布尔 型 数据 和 布尔 (逻辑 ) 运 
算 符 组 成 。 其 中 布尔 型 数据 可 以 由 产生 布尔 型 数值 的 关系 表达 式 代 
替 ; 布尔 运算 符 主要 有 下 列 三 种 :NOT、AND 以 及 OR 运算 。 其 运算 
法 则 为 : 


A B A ANDB AORB NOTA 
TRUE TRUE TRUE TRUE FALSE 
FALSE TRUE FALSE TRUE TRUE 
TRUE FALSE FALSE TRUE FALSE 
FALSE FALSE FALSE FALSE TRUE 

需要 注意 的 是 : 
(1) 数学 上 的 表达 式 :A 之 B 之 C 之 D, 在 PASCAL 语言 必须 写 
成 ; 


(A> =B) AND (B>=C) AND (C> =D) 
(2) 逻辑 运算 必须 写成 诸如 : 
A AND B,A OR B,NOT Ai 
(3) 运算 优先 次 序 为 : 
人 圆 括号 ,由 内 向 外 逐 层 展开 ; 
@ NOT ; 
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@ AND ; 
由 OR ; 
© * /DIV .MOD; 
@ 十 、 一 ; 
GO = 必 二 、 >、 < > 一 所 一 ; 
同一 人 全 和 用 订 让 和 5 
上 0 
BEGIN 
语句 1; 
语句 2; 


合 语句 是 由 一 对 BEGIN 和 END 括 起 来 的 
| 语句 序列 所 组 成 。BEGIN 和 END 起 着 语句 括号 
, 
的 作用 ;其 中 的 语句 是 构成 复合 语句 的 成 分 , 称 为 
成 分 语句 ， 它们 用 分 号 分 隔 。 复 合 语句 的 执行 ,就 
是 按 程序 正文 的 书写 顺序 执行 语句 括号 里 的 成 分 
一 一 二 一 一 语句 (除非 GOTO 语句 才能 改变 执行 成 分 语句 的 
顺序 ), 其 执行 过 程 如 图 2-1 所 示 。 整 个 虚 框 看 作 
2 复合 证 可 是 一 个 语句 , 它 有 一 个 人 口 和 一 个 出 口 。 
3. 如 果 (IF) 语 名 
一 般 形 式 : 
IF 布尔 表达 式 ” THEN 语句 1 
或 IF 布尔 表达 式 THEN 语句 1 ELSE 语句 2 
其 中 ,语句 为 PASCAL 语言 中 的 任何 语句 。 
如 果 语 名 有 两 种 形式 :第 一 种 称 为 IF 一 THEN 语句 , 当 布尔 表 
达 式 的 值 为 TRUE, 则 执行 THEN 后 面 的 语句 ;否则 ,不 执行 (这 时 
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-一 其 中 ,语句 是 指 PASCAL 语言 中 的 任何 语句 。 
| 
| 
| 


一 一 
| 
| 
| 
| 
| 
| 
| 
| 


(a) IF CTHEN S (b) IF CTHEN SI ELSE Ss 
图 2-2 如果 语 名 


的 如 果 语 句 等 效 于 空 语句 ) 。 第 二 种 称 为 Ff 一 THEN 一 ELSE 语句 ， 
当 布 尔 表达 式 的 值 为 TRUE 时 , 则 执行 THEN 后 面 的 语句 1; 否则 
执行 ELSE 后 面 的 语句 2。 它 们 的 执行 过 程 分 别 如 图 2-2Ca)、(b) 所 
示 , 其 中 ,c 表示 布尔 表达 式 ,s,si、s; 分 别 表示 语句 \ 语 句 1 和 语句 2， 

在 如 果 语 句 中 ,车 语句 1 或 语句 2 又 是 一 个 如 果 语 句 , 则 称 为 内 
套 的 正 语 句 。 

例如 :IF 条 件 1 

THEN IF 条 件 2 
THEN 语句 1 
ELSE 语句 2 
ELSE 语句 3 4 

对 于 报 套 的 IF 语句 ,有 可 能 产生 二 义 性 。 例 如 

IF c, THEN IF cy THEN sl 上 ELSE s; 
其 中 ELSE 可 以 同 第 一 个 THEN 配对 ; 
IF eo THEN IF cTHEN s， 

ELSE s， 

也 可 以 同 第 二 个 THEN 配对 : 

IF cy THEN 

IF cy THEN s， 
ELSE Ss, 
在 PASCAL 语言 中 为 解决 这 一 问题 ,规定 ELSE 是 与 它 前 面 最 邻近 
的 还 没有 配对 的 THEN 配对 的 。 即 在 上 例 中 ELSE 规定 同 第 二 个 
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THEN 配对 。 
如 果 在 程序 中 需要 ELSE 和 第 一 个 THEN 配对 , 则 可 以 对 髓 套 
的 内 层 IF 语句 加 一 对 BEGIN 和 END: 
IF c THEN BEGIN IF c THEN s END 
ELSE s， 
4. 分 情形 (CASE) 语 句 
一 般 形式 : 
CASE 表达 式 OF 
分 情形 表 ] : 语句 1; 
分 情形 表 2 : 语句 2; 


分 情形 表 n : 语句 ni 
END 

其 中 ,分 情形 表 由 一 个 或 多 个 常量 组 成 ， 常量 之 问 由 逗号 分 隔 ,语句 
为 PASCAL 语言 中 的 任何 语句 。 

在 CASE 语句 中 ,分 情形 表 内 的 常量 必须 和 表达 式 的 类 型 相 
同 , 且 必 须 是 序数 类 型 ( 整 型 .字符 型 和 枚 举 型 )。 表 达 式 起 着 选择 器 
的 作用 ， 当 表达 式 的 值 等 于 某 一 常量 时 , 则 执行 这 个 标号 后 指明 的 
语句 ,这 个 语句 执行 完毕 ,分 情形 语句 就 完成 了 。 如 果 表 达 式 的 值 与 
任 一 常量 都 不 符合 , 则 CASE 语句 相当 于 一 个 空 语句 。 分 情形 语句 
的 执行 过 程 如 图 2-3 所 示 。 


表达 式 


| 
| 
| 分 情形 表 ] 分 情形 表 2 分 情形 表 n | 
语句 ] | 语句 2 Sa es | 语句 n| 


图 2-3 分 情形 语句 
5， 当 (WHILE) 语 句 
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WHILE 布尔 表达 式 DO 语句 
其 中 ,语句 为 PASCAL 语言 中 的 任何 语句 , 它 体现 了 循环 的 动作 ,所 
以 又 称 为 WHILE 语句 的 循环 体 。 
WHILE 语句 的 执行 过 程 为 ; 
(1) 计算 布尔 表达 式 的 值 , 若 结果 为 TRUE, 则 转 (2); 否 则 , 转 


(3) ; 


(2) 执行 WHILE 循环 体 中 的 语句 ,然后 转 (1); 
(3) WHILE 语句 执行 结束 。 


其 框图 如 图 2-4 所 示 。 


6. 重复 (REPEAT) 语 句 


REPEAT 
语句 1; 
语句 2; 


语句 n 


UNTIL 布尔 表达 式 


图 2-5 重复 语句 


其 中 ,语句 序列 组 成 了 REPEAT 语句 的 成 
分 语句 , 称 为 REPEAT 语句 的 循环 体 。 这 里 
REPEAT 和 UNTIL 起 着 一 对 语句 括号 的 
作用 。 布尔 表达 式 是 结束 条 件 ， 其 执行 过 程 
如 下 : 

(1) 执行 循环 体 ( 语 句 1; 语 名 2;... ; 语 
各 n); 

(2) 计算 布尔 表达 式 , 结 果 为 FALSE 
转 (1) ;否则 转 (3); 

(3) 重复 结束 。 
其 框图 如 图 2-5 所 示 。 
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7. 循环 (FOR) 语 句 
一 般 形 式 ; 
FOR 循环 变量 :一 初 值 表达 式 TO 终 值 表达 式 DO 语句 
或 ”FOR 循环 变量 :== 初 值 表达 式 DOWNTO 终 值 表达 式 DO 语句 
其 中 ,循环 变量 必须 是 序数 类 型 , 它 与 初 值 , 终 值 两 个 表达 式 的 类 型 
必须 赋值 相 容 。 根 据 从 初 值 到 终 值 是 升序 的 还 是 降序 的 ,FOR 语句 
分 别 有 TO 和 DOWNTO 两 种 形式 。 其 中 , 前 者 要 求 初 值 表达 式 的 


” 值 拟 终 值 表达 式 的 值 ;后 者 要 求 初 值 表达 式 的 值 宇 终 值 表达 式 的 值 。 


FOR 语句 的 执行 过 程 为 : 

(1) 计算 初 值 表达 式 和 终 值 表 达 式 ,并 把 初 值 表达 式 的 值 赋 给 
循环 变量 ; 

(2) 循环 变量 与 终 值 表 达 式 的 值 进行 比较 。 对 于 TO 形式 , 当 循 
环 变量 过 终 值 表达 式 时 转 (3)3; 和 否则 转 (4)。 对 于 DOWNTO 形式 , 当 
循环 变量 之 终 值 表达 式 时 转 (3); 否 则 , 转 (4); 

(3) 首先 执行 循环 体 。 然 后 ,对 于 TO 形式 ,循环 变量 取 它 的 后 
继 值 ;对 于 DOWNTO 形式 ,循环 变量 取 它 的 前 驱 值 。 转 (2)， 

(4) 循环 结束 。 
图 2-6 为 FOR 语句 的 框图 ， 


false 


(a) TO 形式 (b) DOWN TO 形式 
2-6 循环 语句 
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8， 转移 GOTO) 语 句 
一 般 形 式 : 
GOTO 语句 标号 

其 中 ,语句 标号 是 在 标号 说 明 部 分 说 明 的 一 个 带 标 号 的 语句 的 标号 。 

GOTO 语句 不 再 顺序 地 执行 程序 ,而 是 转 去 执行 指定 标号 的 语 
名 ,由 于 GOTO 语句 破坏 了 程序 的 结构 ,一般 不 提倡 使 用 。 

9. 过 程 语 名 

一 般 形式 : 

过 程 名 ( 实 参 表 ) 

或 ”过程 名 
其 中 ,过 程 名 是 在 过 程 定义 中 定义 的 过 程 名 。 当 在 过 程 定义 中 有 参数 
说 明 ( 形 式 参 数 表 ) 时 ,过 程 语句 必须 用 第 一 种 形式 ,在 过 程 调用 时 写 
上 同形 式 参 数 相 匹 配 的 实际 参数 。 过 程 语句 的 执行 等 效 于 执行 相应 
过 程 定 义 所 包含 的 语句 序列 。 

在 PASCAL 语言 中 提供 了 一 些 标 准 的 输入 /输出 过 程 :read ( 参 
量 表 ) ,readln( 参量 表 ) ,write( 参 量 表 ) ,writeln (参量 表 )，。 
其 中 

(1) read ,readln 用 于 输入 数据 ;write ,writeln 用 于 输出 数据 。 

(2) read 要 求 至 少 输入 一 个 数据 ,但 不 要 求 换行 ;readln 要 求 输 
入 完 数据 后 换行 ,但 可 以 不 输入 任何 数据 ,只 执行 换行 。 

(3) write 要 求 至 少 输出 一 个 数据 ,但 数据 输出 完 不 换行 ; 
writeln 数据 输出 后 换行 ,但 可 以 不 输出 任何 数据 ,只 执行 换行 。 


三 、 用 户 自 定 义 的 数据 类 型 


1. 枚 举 类 型 

一 般 形式 : 

TYPE 类 型 标识 符 二 (标识 符 1, 标 识 符 2,… ,标识 符 n); 

枚 举 类 有 蛋 的 值 是 一 些 标识 符 , 称 为 枚 举 标 识 符 , 枚 举 类 型 是 通过 
列举 所 有 的 枚 举 标识 符 定义 一 个 有 序 集合 。 枚 举 类 型 的 数据 只 能 取 
这 些 标识 符 中 的 一 个 。 枚 举 类 型 是 有 序 的 ,每 个 要 举 标识 符 都 有 一 个 
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序数 ,第 一 个 枚 举 标识 符 的 序数 为 0, 此 后 , 按 枚 举 的 次 序 , 依 次 为 
本 

例如 :用 枚 举 类 型 定义 一 个 星期 

TYPE day= (Sun, Mon,Tues, Wed,Thur ,Fri,Sat); 

对 于 枚 举 类 型 的 数据 有 以 下 标准 函数 :succ(x)( 求 x 的 后 继 )， 
pred(x)( 求 x 的 前 趋 ) ,ord(x)( 求 x 的 序号 )。 例 如 ; 

succ (Mon)= Tues,pre(Mon)=Sun,ord(Mon)=1 

2. 于 界 类 型 

一 般 形式 : 

TYPE ”类 型 标识 符 二 常量 1.. .常量 2; 
其 中 ,常量 1, 常 量 2 分 别称 为 下 界 和 上 界 ,必须 属于 同一 类 型 ,一 般 
为 整 型 .字符 型 \ 枚 举 型 ,而 且 ord (常量 1)< 过 ord (常量 2)。 

子 界 类 型 定义 了 一 个 已 定义 过 的 类 型 的 子 界 ,该 已 定义 过 的 类 
型 称 为 主 类 型 。 一 个 子 界 类 型 的 数据 和 它 的 主 类 型 数据 具有 相同 的 
运算 操作 ,只 是 其 取 值 范围 只 能 在 子 界 之 内 。 

例如 :把 星期 一 到 星期 六 定义 成 工作 日 , 它 是 类 型 day 的 一 个 子 
界 类 型 。 

TYPE workday = (Mon. . Sat);; 

3. 集合 类 型 

一 般 形 式 : 

TYPE 类 型 标识 符 二 SET OF 基 类 型 ; 
其 中 , 基 类 型 只 能 是 序数 类 型 ( 整 型 ,字符 型 , 枚 举 型 , 子 界 型 ,布尔 
型 )。 集 合 类 型 的 数据 是 基 类 型 数据 值 的 集合 的 子 集 ,对 于 集合 类 型 
数据 可 以 作 关系 运算 和 集合 运算 。 关 系 运 算 有 五 种 : 

(1) 二 : 判 两 个 集合 是 否 相 等 ,相等 时 结果 为 TRUE; 否则 为 
FALSE ; 

(2) 二 >>: 判 两 个 集合 不 等 ,不 相等 时 结果 为 TRUE; 和 否则 为 
FALSE; 
(3) 二 = :, 判 左 边 的 集合 是 否 蕴含 于 右边 的 集合 ,结果 为 布尔 
值 ; 
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(4) 之 一 : 判 左边 的 集合 是 否 蕴 含 右边 的 集合 ,结果 为 布尔 值 ; 

(5) IN: 判 一 个 元 素 是 否 属于 一 个 集合 。 敬 集合 A 中 存在 元 素 
x, 则 x IN A 的 结果 为 TRUE ;否则 为 FALSE，; 

集合 运算 有 三 种 :集合 并 (十 ) ,集合 交 (C(x ) ,集合 差 ( 一 )，。 

下 面 是 一 个 集合 定义 的 例子 , 它 定义 十 个 数字 字符 的 集合 : 

TYPE digitset =SET OF "0 … 9 ; 

4. 数组 类 型 

一 般 形式 : 

TYPE 类 型 标识 符 一 ARRAY[ 下 标 类 型 1,… ,下 标 类 型 n] OF 
成 分 类 型 。 
其 中 ,下 标 类 型 可 以 有 一 个 或 多 个 , 它 只 能 是 枚 举 型 , 子 界 型 ,字符 
型 之 一 。 数 组 有 一 个 下 标 时 , 称 为 一 维 数组 ;有 n 个 下 标 时 , 称 为 n 维 
数组 。 成 分 类 型 可 以 是 PASCAL 语言 中 的 任何 类 型 , 它 规定 了 数组 
成 分 的 类 型 。 

数组 类 型 是 由 固定 数量 的 具有 相同 类 型 的 成 分 变量 组 成 。 每 个 
成 分 变量 是 通过 数组 变量 名 跟 以 数组 下 标 来 直接 访问 的 ;下 标 可 以 
是 表达 式 , 其 类 型 同 相 应 的 下 标 类 型 一 致 ;这 种 访问 是 完全 随机 的 ， 
故 数组 被 称 为 随机 访问 结构 。 

例如 :定义 了 30 个 学 生 的 成 绩 为 一 个 数组 ， 

TYPE studentgrade 一 ARRAYL[L1. .30] OF real; 
这 是 一 个 一 维 数组 , 它 的 下 标 类 型 是 整 型 的 子 界 1.. 30, 其 成 分 类 型 
为 实 型 ,studentgrade 是 数组 类 型 标识 符 。 定 义 了 一 个 数组 之 后 ,在 
变量 说 明 中 ,就 可 以 按 通 常 方 式 说 明 数 组 变量 : 
VAR student ; studentgrade ; 

数组 变量 student 有 30 个 成 分 变量 ;student[ 1 j ,student[ 2 ] ,…… ,stu- 
dent[ 30], 每 个 成 分 变量 都 是 实 型 变量 。 

5. 记录 类 型 

”一 般 形式 : 
TYPE 类 型 标识 符 三 RECORD 域 表 end; 
域 表 二 固定 部 分 
ee 


或 攻 定 部 分 ; 变 体 部 分 

其 中 ,固定 部 分 为 :记录 项 1; 记 录 项 2;…; 记 录 项 n。 
记录 项 定义 为 :项 标识 符 1, 项 标识 符 2,… ,项 标识 符 nn: 类 型 

从 记录 的 固定 部 分 可 以 看 出 ,一 个 记录 由 一 些 记录 项 组 成 ， 每 
个 记录 项 合 有 各 十 个 项 标识 符 , 并 且 对 它 规 定 类 型 。 

例如 :定义 由 年 .月 .日 三 项 组 成 的 日 期 这 样 的 数据 类 型 如 下 : 

TYPE on 一 (Jan:Feb,Mar,Apr:May,Jun ,Jul,Aug,Sep,Oct ，Nov， 

Dec ) ; 


deie = RECORD 
year :integer ; 
month :mon ; 
day : 1…31 
END:; 
VAF today : datc; 
在 这 里 ,year、month、day 称 为 项 ,today 被 说 明成 date 型 的 变 
量 。 对 于 记录 变量 可 以 访问 其 某 一 个 成 份 (项 )。 记 录 变 量 的 成 份 表 
示 为 :记录 变量 名 .成 分 名 ;上 例 中 为 today. year ,today. month ,to- 
day. day 。 
在 一 小 段 程序 中 如 需 多 次 访问 一 个 记录 的 同一 成 分 或 同一 记录 
的 不 同 成 分 ,可 以 使 用 开 域 语句 WITH 以 提供 一 种 缩写 表示 法 。 开 
域 语句 的 形式 为 : 
WITH 记录 变量 DO 语句 
在 语句 中 只 要 直接 使 用 该 记录 的 记录 项 即 可 。 
例 : 
WITH today DO 
BEGIN 
year:—1994; 
month:=Jan; - 
day: 王 10; 
END:; 
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在 这 里 就 不 用 写成 : today. year ;一 19943*… 
记录 类 型 的 语法 还 提供 了 变 体 部 分 , 它 允 许 同一 种 记录 类 型 的 
变量 具有 一 - 些 不 同 的 结构 ,表现 在 它们 中 某 些 成 分 的 数目 种 类 型 上 
的 不 间 。 例 如: 我 们 定义 一 个 人 的 记录 包括 :人 名 、 生日、 性别 和 婚姻 
状况 ,其 中 在 婚姻 状况 中 ,对 结婚 的 人 记录 配偶 的 姓名 和 结婚 日 期 ; 
对 离 过 婚 的 人 记录 离婚 日 期 和 是 否 第 一 次 离婚 ;对 单身 的 人 记录 是 
从 独居 。 其 形式 如 下 : 
TYPE alfa 一 ARRAYL1…20] OF char ; 
date 一 《如 上 } 
matrstatus 一 (married , divorced ,single ); 
person 一 人 RECORD 
name : alfa 
birthday : date; 
sex : (male,f{emale); 
CASE ms :marstatus OF 
married : (spousename:alfa; mdate :date):; 
divorced : (ddate:date; fstd :booican ) ; 
single : (indepdt :boolean ) 
END:; 
6. 指针 类 型 
一 般 形 式 : 
TYPE 类 型 标识 符 二 个 日 标 类 型 ; 
其 中 ,目标 类 型 是 PASCAL 语言 中 的 任何 类 型 标识 符 。 我 们 称 定义 
的 类 型 为 指 问 目标 类 型 数据 的 指针 类 型 。 
例 : 
TYPE link = ‘node ; 
node = RECORD 
data : integer ; 
next : link : 
END; 
VARP :lnk ; 
在 这 里 我 们 定义 了 link 为 指向 node 类 型 数据 的 指针 类 型 。 指 针 
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类 型 是 一 种 动态 的 数据 类 型 ,一 旦 程序 执行 时 需要 生成 一 个 node 类 
型 的 新 变量 (动态 变量 ) 时 ,可 以 调用 标准 过 程 : 

new(p); 
其 中 ,p 为 指针 变量 ,作为 过 程 new 的 实在 参数 。 调 用 该 过 程 将 动态 
分 配 一 个 node 型 变量 的 存储 空间 ,产生 指向 这 个 新 变量 的 存储 地 
址 ,并 把 该 地 址 作为 指针 值 赋 给 指针 变量 p。 由 于 新 变量 并 不 经 变量 
说 明 ,所 以 不 采用 象 静态 变量 那样 的 标识 符 , 而 是 用 pf+ 来 标记 它 ,p 
+ 称 为 引用 变量 。 必 须 千 万 注意 ,不 要 混淆 指针 P( 属 于 指针 型 link 
或 个 node) 和 它 所 指向 的 变量 p4 (属于 类 型 node) 。 如 图 2-7 为 指针 
与 它 所 指 变量 的 示意 : 


p 当 程 序 执行 时 需要 取消 一 
个 由 new 产生 的 动态 变量 时 ， 
可 以 调用 如 下 标准 过 程 ， 
图 2-7 指针 p 和 它 所 指向 的 变量 p 人 dispose (p); 


其 中 ,P 为 指针 变量 , 它 作 为 过 程 dispose 的 实在 参数 。 调 用 该 过 程 将 
p 指向 的 动态 变量 p^ 的 存储 空间 释放 ,使 p44 变 为 不 可 访问 ,p 的 值 
也 就 无 定义 。 


2.2 框图 介绍 和 算法 分 析 


在 上 一 节 我 们 简单 地 介绍 了 有 关 PASCAL 语言 的 内 容 。 本 书 
中 算法 主要 是 以 文字 ,框图 的 形式 进行 描述 ,下 面 对 框图 中 使 用 的 符 
号 分 别 介 绍 。 

本 书 框图 中 使 用 的 图 形 符号 如 图 2-8 所 示 。 

1. 椭圆 框 : 框 中 用 文字 标明 算法 的 “开始 ”或 “结束 ”。 

2. 和 矩形 框 ; 框 内 描述 某 些 操作 ,如 赋值 .组 织 循环 .输入 和 输出 
等 ,统称 为 操作 框 。 

3. 菱形 框 (包括 变相 菱形 框 ): 称 为 判别 框 , 框 中 符号 冒号 “:” 
表示 比较 。 例如 n:0 表示 n 与 0 相 比 较 ,比较 的 结果 写 于 框 外 连接 
线条 的 旁边 . 带 和 能 头 的 线条 表示 算法 或 程序 的 走向 , 写 于 其 旁 的 判断 
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“结果 就 是 算法 或 程序 的 分 支 走向 


应 满足 的 条 件 。 
对 算法 (或 程序 ) 的 分 析 和 评 (a) 椭 贺 框 
a onl eset (b) 算 形 框 


性 .简单 性 .最 优 性 .运算 量 及 占 ”= < 人 > 

用 存储 量 等 诸多 因素 。 为 了 简化 
讨论 ,我 们 仪 采用 其 中 的 两 条 标 (c) 萎 形 杠 (d) 变形 薰 形 杠 

准 : 其 一 是 用 问题 的 某 个 参数 的 

函数 来 估算 其 存储 量 ;其 二 是 讨 图 2-8 框图 所 用 图 形 

论 数 据 运算 所 需 的 计算 量 。 假设 问题 的 参数 为 n, 此 参数 可 以 是 矩阵 
的 阶 、 线 性 表 的 长 度 、 图 的 顶点 数 等 显示 该 问题 规模 大 小 的 参数 , 那 
么 在 所 选 数 据 结 构 上 执行 有 关 操作 所 需要 的 存储 量 及 计算 量 是 n 的 
什么 函数 呢 ? 我 们 引进 记号 “0”, 对 这 些 函 数 作 数量 级 的 估算 . 例如 ， 
对 于 下 述 三 个 简单 程序 段 

(1) 1 

(2) FOR i:=]1 TOn DO x.:=x=1; 

(3) FOR i:=1 TO n DO 

FOR j:=1 TOn DO x: 一 x 十 1; 

在 程序 段 中 1 中 ,语句 x;= 二 x 十 1 不 包含 在 任何 循环 体 之 中 ,此 
语句 只 执行 一 次 ,计算 量 可 记 为 O(1)。 在 程序 段 2 中 ,上 述 赋值 语句 
在 FOR 循环 之 中 ,所 以 要 执行 n 次 ,其 执行 时 间 和 nm 成 正比 ,计算 量 
可 记 为 O(n), 在 程序 段 3 中 ,x:=x 十 1 语句 要 执行 nXn 次 ,其 执行 
时 间 和 mm 成 正比 , 故 计算 量 可 记 为 O(n?)。 对 于 算法 或 程序 所 需 的 
存储 量 ,也 可 以 作 类 似 分 析 。 然 而 ,要 事先 对 一 个 算法 的 计算 量 作 仔 
细 的 分 析 很 复杂 ,而 且 也 不 是 本 课程 的 主要 内 容 , 所 以 书 中 对 一 些 算 
法 的 性 能 评价 只 根据 算法 中 执行 次 数 最 多 的 语句 来 估算 其 计算 量 的 
数量 级 。 
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习 圳 


1. 下 面 程序 的 执行 结果 是 什么 ? 
PRAGRAM ex (input ,output); 
CONST n=4; 

VAR x,p.i,sum:integer; 


BEGIN 
SuUm : 一 昌 
FOR x: =1 TO 4 DO 
BEGIN 
ps-= 1; 
FOR i:=1 TO x DO 
p:—P*X; 
sum: 二 sum 十 p 
END:; 
writeln (sum) 
END 


2. 请 用 框图 (流程 图 ) 描 述 下 列 问题 的 算法 。 

(1) 输入 三 个 数 ab.c, 要 求 按 从 小 到 大 的 次 序 输出 。 

(2) 找 出 一 组 数 a[1],a[2j,…,aLn] 中 的 最 大 数 和 最 小 数 。 
3， 找 出 下 面 PASCAL 语言 程序 中 的 语法 错误 。 

PRAGRM ex$w(Cinputy,output) 


CONSt pi: =3.14159; 
bool = false; 


TYPE k=1.05710.03 
VAR 1,]: integer; 
bool ;boolean ; 
p:node; 
BEGIN 
sum:= 0 


FOR I:=1 TO 100 
sum :一 Sum 十 1; 
write("sum 一 ”Sum)》 
END 
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第 三 日 线性 表 


从 第 三 日 到 第 六 日 我 们 将 讨论 线性 结构 :线性 表 、 栈 、 队 列 、 申 、 
数组 。 线 性 结构 的 特点 是 ;在 数据 元 素 的 非 空 有 限 集合 中 ,存在 唯一 
的 一 个 数据 元 素 被 称 为 第 一 个 元 素 ; 存 在 唯一 的 一 个 数据 元 素 被 称 
为 最 后 一 个 元 素 ; 除 第 一 个 元 素 之 外 ,其 余 的 数据 元 素 均 有 唯一 的 直 
接 前 驱 元 素 ; 除 最 后 一 个 元 素 之 外 ,其 余 的 数据 元 素 均 有 唯一 的 直接 
后 继 元 素 。 在 以 后 各 日 讨论 各 种 数据 结构 时 ,我们 都 将 首先 介绍 有 关 
结构 的 基本 概念 和 基本 运算 ,然后 讨论 它 在 计算 机 中 的 存储 结构 以 
及 在 不 同 的 存储 结构 上 相应 操作 的 实现 ,最 后 再 介绍 有 关 应 用 ,下 面 
我 们 将 按 上 述 顺序 首先 介绍 线性 表 。 


3. 1] 线性 表 及 其 基本 操作 


一 、 线 性 表 的 基本 概念 


线性 表 (iinear-list) 是 最 常用 、 最 简单 的 一 种 数据 结构 。 简 而 言 
之 ,一 个 线性 表 是 (n 之 0) 个 数据 元 素 (a1,as,…,a,) 的 有 限 序列 。 数 
据 元 素 的 具体 含义 是 各 种 各 样 的 ,可 以 是 一 个 数 , 一 个 字符 ,或 一 张 
表格 等 。 以 下 是 三 个 线性 表 的 例子 ，。 

例 1: (70,32,51,101,6) 是 一 个 线性 表 , 其 中 的 数据 元 素 为 整 
数 , 共 有 5 个 数据 元 素 。 

例 2:(A ,B,C,…,2Z) 是 一 个 线性 表 , 其 中 的 数据 元 素 为 大 写 英 
文字 母 ,共有 26 个 数据 元 素 。 

例 3: 图 3-1 所 示 的 学 生 一 门 课程 的 成 绩 单 也 是 一 个 线性 表 。- 

a 


其 中 的 数据 元 素 是 每 一 个 学 生 所 占 
据 的 整 栏 表 格 ,包括 姓名 、 学 号 、 性 
别 、 成 绩 共 有 四 个 数据 项 。 通 常 把 这 
种 由 多 个 数据 项 组 成 的 一 个 数据 元 
素 称 为 一 个 记录 。 
综合 上 述 三 例 ,可 以 对 线性 表 作 
如 下 的 形式 定义 : 
A 含有 n 个 数据 元 素 的 线性 表 是 
一 个 数据 结构 : 
linear-list = (D,R) 
其 中 ， D= {a: |a: €E datatype, 1<i<n,n 之 0]} 
R=={N},N= {(a_ 1,ai) |a;_1;a1 €E datatype ,2<1<n) 
datatype 为 某 种 数据 对 象 
从 定义 中 我 们 可 以 得 知 :不 同 线性 表 中 的 数据 元 素 可 以 是 名 种 
各 样 的 ,但 同 -- 线 性 表 中 的 元 素 必定 具有 相同 的 性 质 ,属于 同一 数据 
对 象 。 关 系 R 是 一 个 序 偶 的 集合 , 它 表示 线性 表 中 数据 元 素 之 间 的 
相 邻 关系 , 即 ai_1 领 先 于 aiyai 领先 于 ai+l。 我 们 称 ai_l 是 ai 的 直接 前 
驱 元 素 ; 称 a 是 a_, 的 直接 后 继 元 素 。 线 性 表 中 数据 元 素 的 个 数 n 称 
为 线性 表 的 长 度 。 当 n=0 时 , 称 为 空 表 ; 当 n>>0 时 ,线性 表 通 常 记 为 
(a1sa2，"… ai，"…* 9an) ,其 中 al 称 为 第 一 个 数据 元 素 ,an 是 最 后 一 个 数 
据 元 素 。 当 i=1,2,…,n 一 1 时 ,a; 有 且 仅 有 一 个 直接 后 继 ai+1; 当 i= 
2,3,…,n 时 ,a; 有 且 仅 有 一 个 直接 前 驱 a-:。 因 此 ,线性 表 是 一 个 线 
性 结构 。 


二 、 对 线性 表 的 操作 


线性 表 是 一 种 非常 灵活 的 数据 结构 ,对 线性 表 中 的 数据 元 素 不 
仅 可 以 进行 访问 ,还 可 以 进行 插入 和 删除 操作 .对 线性 表 的 基本 操作 
有 以 下 几 种 ， 
1. 初始 化 (initial(L)) : 设 定 一 个 空 的 线性 表 L，。 
2. 求 长 度 (length(L)) :运算 的 结果 是 求 得 线性 表 的 长 度 , 即 给 
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出 线性 表 工 中 数据 元 素 的 个 数 。 

3. 存 取 亏 素 (get(L,i)); 此 运算 仅 当 1 二 i 过 length (L) 时 有 意 
义 ,其 结果 为 取 线性 表 工 中 第 i 个 数据 元 素 。 

4. 定位 (locate(L,x)): 若 线性 表 世 中 存在 值 为 x 的 数据 元 素 
ai， 则 运算 结果 为 a; 在 线性 表 中 的 序号 i; 否 则 为 零 , 若 存在 多 个 值 为 
x 的 数据 元 素 , 则 结果 为 其 中 序号 最 小 的 一 个 。 

5. 插入 (insert(L,i,b)); 把 给 定 元 素 b 插 入 到 线性 表 工 的 第 i 
个 位 置 ,使 长 度 为 n 的 线性 表 (as ,as，…,ai_1,a;,… ,a,), 变 成 长 度 为 
n 十 ] 的 线性 表 (al ,a;s,…， ai_ib,ai,. ,an)。 

6. 删除 (delete(L,i,b)): 此 运算 仅 当 1<i<length(L) 时 才 有 意 
义 ,结果 就 是 把 线性 表 工 的 第 i 个 数据 元 素 ai 从 工 中 删除 ,使 长 度 
为 n 的 线性 表 (a, az ai-lyaiya+l…yan) 变 成 长 度 为 n 一 1 的 线性 
表 (ai，…ai-iyai+l，…wyan)。 

7. 判 空 表 (empty(L)): 若 世 为 空 表 , 则 返回 布尔 值 TRUE ;和 否 
则 ,返回 布尔 值 FALSE。 

除 上 述 基本 运算 外 ,对 线性 表 还 可 以 进行 一 些 更 复杂 的 运算 。 
如 :将 两 个 或 两 个 以 上 的 线性 表 合 并 成 一 个 线性 表 ; 把 一 个 线性 表 分 
解 成 两 个 或 两 个 以 上 的 线性 表 ; 重 新 复制 一 个 线性 表 ; 对 线性 表 中 的 
数据 元 素 按 某 个 数据 项 递增 (或 递减 ) 的 顺序 进行 重新 排列 等 等 。 这 
些 操作 均 可 利用 上 述 的 基本 运算 来 实现 。 


3.2 线性 表 的 顺序 存储 结构 


在 计算 机 的 内 存 中 ,可 以 用 不 同 的 方式 来 存储 一 个 线性 表 。 我 们 
将 介绍 两 种 基本 的 方法 , 即 顺 序 存 储 和 链 式 存储 。 在 这 一 小 节 中 讨论 
顺序 存储 。 


一 、 上 顺序 存储 


计算 机 的 内 存 是 由 有 限 多 个 存储 单元 组 成 的 ,每 个 存储 单元 都 
有 了 唯一 的 地 址 ,各 存储 单元 的 地 址 是 连续 编号 的 。 对 于 一 个 线性 表 ， 
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如 果 用 一 组 连续 的 存储 单元 依次 存放 它 的 各 个 数据 元 素 , 这 就 是 线 
性 表 的 顺序 存储 。 
假设 线性 表 的 每 个 元 素 需 占 C 个 单元 ,并 且 每 个 元 素 用 其 所 占 
的 第 一 个 存储 单元 的 地 址 作为 该 数据 元 素 的 存储 位 置 , 则 线性 表 中 
第 i 十 1 个 数据 元 素 的 存储 位 置 Loc (ai41) 与 第 i 个 元 素 的 存储 位 置 
Loc(ai) 之 间 满 足下 列 关 系 : 
Loc(ai+) 王 ljoc(ai) 十 c 
一 般 来 说 ,线性 表 中 第 i 个 元 素 的 存储 位 置 为 ; 
Loc(ai) 一 Loc(ai) 十 (i 一 1) xc 
其 中 ,Loc(ai) 是 线性 表 中 第 一 个 数据 元 素 ai 的 存储 位 置 ,通常 称 它 
为 线性 表 的 起 始 位 置 或 基地 址 。 如 图 3-2 是 线性 表 顺 序 存储 的 示意 
图 ， 


存储 位 置 ”内 存 状态 元素 序号 线性 表 有 顺序 存储 结构 的 

on 1 特点 是 为 表 中 逻辑 上 相 邻 的 

元 素 as 和 aa; 贼 以 相 邻 的 存 

L 二 Cn 一 1)*C 储 位 置 Loc (ai) 和 Lec 
(ai+1) 。 也 就 是 说 ,以 元 素 在 


3-2 线性 表 顺 序 存储 结构 示意 图 计算 机 中 存储 位 置 的 相 邻 来 


表示 线性 表 中 数据 元 素 之 间 罗 辑 上 的 相 邻 关 系 。 每 一 个 数据 元 素 的 
存储 位 置 和 线性 表 的 起 始 位 置 相差 一 个 和 数据 元 素 在 线性 表 中 的 序 
号 成 正比 的 常数 。 所 以 ,只 要 确定 了 起 始 位 置 ,线性 表 中 任 一 数据 元 
素 均 可 随机 存 取 , 因 此 线性 表 的 顺序 存储 结构 是 一 种 随机 存 取 的 存 
储 结构 .在 PASCAL 语言 中 可 以 用 一 维 数组 (向 量 ) 来 描述 线性 表 的 
顺序 存储 结构 ,其 描述 如 下 : 
CONST maxlength== {线性 表 可 能 的 最 大 长 度 }; 
TYPE sequenlist =— RECORD 
elements: ARRAYI[1:…maxlength | OF elementype:; 
last :integer; 
END 
在 上 述 描述 中 ,线性 表 顺 序 存储 结构 是 一 个 记录 型 的 结构 ， 其 
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中 数据 域 elements 描述 了 线性 表 中 数据 元 素 占 用 的 向 量 空间 ,向量 
的 第 i 个 分 量 为 线性 表 中 第 i 个 数据 元 素 的 存储 映 象 ,每 个 数据 元 素 
的 类 型 为 elementype; 数 据 域 last 指示 最 后 一 个 数据 元 素 在 向 量 空 
间 中 的 位 置 ,在 此 ,数据 元 素 的 存储 位 置 可 以 用 其 在 向 量 中 的 下 标 值 
来 表示 。 

在 这 种 存储 结构 中 ,线性 表 的 某 些 运 算 很 容易 实现 。 如 :线性 表 
的 长 度 即 为 last 域 的 值 等 等 。 下面 讨 论 在 这 种 存储 结构 下 ,线性 表 的 
插入 和 删除 两 种 运算 。 


二 、 线 性 表 顺 序 存储 结构 下 的 插入 


线性 表 的 插入 操作 是 指 在 线性 表 的 第 i 一 1 个 数据 元 素 和 第 i 个 
数据 元 素 之 间 插 入 一 个 新 的 数据 元 素 b. 这 就 需要 将 第 i 个 到 第 n 个 
数据 元 素 均 向 后 移动 一 个 位 置 ， 然 后 将 新 元 素 b 存 人 向 量 的 第 i 个 
位 置 。 图 3-3 是 线性 表 插 入 操作 的 示意 图 : 


图 3-3 线性 表 插 人 示意 图 


线性 表 插 入 新 元 素 b 后 , 仍 是 一 个 线性 表 , 不 同 的 是 其 长 度 由 原 
来 的 n 变 为 n 十 1, 数 据 元 素 a_, 和 ai 之 间 的 逻辑 关系 发 生 了 变化 ,而 
其 存储 结构 还 是 顺序 存储 。 
当 我 们 将 插入 操作 写成 算法 时 ,还 要 考虑 插入 算法 的 通用 性 和 
可 能 出 现 的 错误 。 例 如 , 当 给 定 的 线性 表 已 占 满 整 个 向 量 空间 时 ,再 
。35。 


插 和 人 新 元 素 就 要 溢出 或 插入 位 置 不 在 线性 表 的 范围 内 时 就 要 出 错 。 
图 3-4 是 在 顺序 存储 结构 下 插 人 算法 的 框图 描述 。 


图 3-4 线性 表 顺 序 存 储 结 构 的 插入 算法 框图 
在 线性 表 的 顺序 存储 结构 中 ,插入 元 素平 均 移 动 元 素 的 次 数 是 
比较 多 的 。 如 果 在 第 一 个 元 素 之 前 插入 新 元 素 则 要 将 线性 表 中 所 有 
的 元 素 全 部 向 后 移动 一 个 位 置 ; 只 有 在 表 尾 插 和 人 一 个 新 元 素 时 , 才 不 
需要 移动 数据 元 素 。 假 设 在 线性 表 的 任何 位 置 (包括 在 表 尾 ) 插 入 新 
元 素 的 概率 是 相等 的 , 即 在 第 i(i 二 1,…,n 十 1) 位 置 上 插入 新 元 素 的 
概率 都 等 于 1/ (n 十 1), 则 插入 操作 中 元 素平 均 移 动 次 数 为 
E, 一 (n 十 Cn 一 1) 十 .. .十 1 十 0)/(《n 十 1) 
一 D/2 


三 、 线 性 表 顺 序 存储 结构 的 删除 


线性 表 的 删除 操作 是 把 线性 表 中 的 第 i 个 元 素 删 去 。 这 就 需要 
将 第 i 十 1 个 到 第 n 个 元 素 向 前 移 一 个 位 置 ,并 且 线 性 表 的 长 度 减 1， 
删除 算法 的 框图 描述 如 图 3-5 所 示 。 
对 于 线性 表 顺 序 存储 结构 的 删除 操作 ， 假定 线性 表 的 长 度 为 nD， 
且 删 除 线性 表 中 任何 位 置 上 的 数据 元 素 的 概率 相等 , 即 等 于 1/n, 则 
删除 操作 中 平均 的 元 素 移 动 次 数 为 
。30. 


Ei==((n 一 1) 十 (n 一 2) 十 ... 十 1 十 0)/n==(n 一 1)/2 

由 上 述 操 作 可 知 ， 

对 于 线性 表 的 顺序 存储 
结构 ,其 结构 简单 且 便 
于 随机 访问 线性 表 中 的 
任 一 元 素 ,但 不 便于 进 
行 插入 和 删除 操作 ; 另 
外 ,如 果 要 扩大 向 量 的 
容量 往往 会 很 困难 。 为 


组 织 循环 : 
将 第 ;十 1 个 元 素 到 n 个 
元 素 均 向 前 移动 一 个 位 置 


了 克服 顺序 存储 结构 的 
缺点 ,人 们 提出 了 另外 
一 种 存储 结构 一 一 链 式 图 3-5 线性 表 顺 序 存储 结构 的 删除 算法 框图 


存储 结构 (链表 ) 。 
3.3 线性 表 的 链 式 存储 结构 


上 一 节 我 们 讨论 了 线性 表 的 顺序 存储 结构 ,其 特点 是 逻辑 关系 
上 相 邻 的 两 个 元 素 在 物理 位 置 上 也 相 邻 。 本 节 我 们 将 讨论 另 一 种 存 
储 结构 一 一 链 式 存储 结构 , 它 不 要 求 逻 辑 上 相 邻 的 元 素 在 物理 位 置 
上 也 相 邻 。 


一 、 线 性 链表 


线性 表 的 链 式 存储 结构 是 用 一 组 任意 的 存储 单元 存储 线性 表 中 
的 数据 元 素 ; 这 组 存储 单元 可 以 是 连续 的 ,也 可 以 是 不 连续 的 。 因 此 ， 
为 了 表示 数据 元 素 ai 与 其 直接 后 继 元 素 ai+l 之 间 的 逻辑 关系 ,对 于 
数据 元 素 ai 来 说 , 除了 存储 元 素 本 身 的 信息 之 外 ,还 需 存储 指示 其 
直接 后 继 的 信息 ( 即 直 接 后 继 的 存储 位 置 )。 这 两 部 分 信息 组 成 数据 
元 素 ai 的 存储 映 象 , 称 为 结 点 (node), 它 包含 两 个 域 ;一 个 域 用 于 存 
储 数 据 元 素 的 信息 称 为 数据 域 ; 另 一 个 域 用 于 存储 直接 后 继 元 素 的 
存储 位 置 称 为 指针 域 ( 或 链 域 ) 在 PASCAL 语言 中 可 以 用 如 下 的 指 
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针 类 型 描述 一 个 结 A : 
TYPE pointer 一 “ nodetype; 
nodetype = RECORD 
data : elemtp; 
next ; pointer; 
END:; 
其 中 ,pointer 是 一 个 指针 类 型 ,nodetype 表示 结 点 类 型 。 在 一 个 结 点 
中 有 两 个 域 :data 域 用 于 表示 数据 元 素 , 其 类 型 为 elemtp,elemtp 根 
据 实际 而 定 , 可 以 是 一 个 整 型 数 , 也 可 以 是 一 个 字符 等 ;next 域 是 指 
针 域 , 用 于 指示 直接 后 继 元 素 的 存储 位 置 。 这 样 由 nn 个 数据 元 素 的 n 
个 结 点 通过 next 域 链 结 成 一 个 链表 , 即 为 线性 表 (al,as,… ,a,) 的 链 
式 存储 结构 即 链表 。 由 于 此 链表 的 每 个 结 点 只 含 一 个 指针 域 , 故 又 称 
例如 :有 -线性 表 (49,38,65,98,27,16), 它 的 线性 链表 存储 结 
构 如 图 3-6 所 示 。 
由 此 我 们 可 以 看 出 ,在 线性 
表 的 链 式 存储 结构 中 ,数据 元 素 
之 间 的 逻辑 关系 是 由 线性 链表 
中 结 点 的 指针 域 表 示 。 换 句 话 
说 ,指针 是 数据 元 素 之 间 逻 辑 关 
图 3.6 线性 链表 的 物理 状态 图 示 。 系 的 映 象 ,而 结 点 在 存储 名 中 的 
位 置 是 可 以 任意 按 排 的 。 另 外 ， 
在 线性 链表 中 必须 指出 第 一 个 元 素 的 存储 地 址 ,所 以 需要 设立 一 个 
特殊 的 指针 , 称 为 头 指针 (head) 。 而 由 于 最 后 一 个 元 素 没有 直接 后 
继 , 所 以 它 的 指针 域 的 值 为 “ 空 >Cnil) 。 在 线性 链表 中 ， 当 头 指针 为 . 
“ 室 ”(head 一 nil) 时 ,表示 线性 表 为 空 表 。 
由 于 如 图 3-6 表示 的 线性 链表 ,数据 元 素 的 逻辑 顺序 不 易 观察 ; 
而 在 实际 应 用 中 我 们 往往 只 关心 线性 表 中 元 素 的 逻辑 顺序 ,而 不 是 
元 素 在 存储 器 中 的 位 置 。 所 以 ,通常 我 们 把 线性 链表 用 图 3-7 所 示 的 
形式 表示 。 
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Head 
[L 才 一 村 ~ 村 ~15[ 村 ~[EET 村 ~ 区 
图 3-7 线性 链表 的 逻辑 状态 图 示 

其 中 , 结 点 之 间 的 箭头 表示 指针 域 , 符 号 “人 ”表示 nil。 有 时 ,我 们 在 
线性 链表 的 第 一 个 结 点 之 前 附设 一 个 结 点 , 称 之 为 头 结 点 。 头 结 点 的 
数据 域 可 以 不 存储 任何 信息 ,也 可 用 于 存储 诸如 线性 表 长 度 等 附加 
信息 ; 头 结 点 的 指针 域 用 于 存储 第 一 个 元 素 的 存储 位 置 。 如 图 3-8 
(a) 所 示 ，, 此 时 线性 链表 的 头 指针 指向 头 结 点 。 若 线性 表 为 空 表 , 则 头 
结 点 的 指针 域 的 值 为 “ 空 ”, 如 图 3-8(b) 所 示 ; 


Head Head 
[ 才 -~ 听 十 -村 ~- 芭 [ 寺 -… 一 巴 凡 [~- 辆 入 
(a) 非 空 表 (b) 空 表 


图 3-8 带头 结 点 的 线性 链表 图 示 
对 任何 -- 种 数据 结构 来 说 ,不 管 采用 什么 样 的 存储 结构 ,都 必须 
能 表示 出 元 素 之 间 的 逻辑 关系 ;对 存储 结构 的 选择 ,往往 是 以 提高 特 
定 操作 的 效率 为 依据 。 


二 、 线 性 链表 的 插入 


奋 有 线性 表 (al,az,…，an), 用 带头 结 点 的 线性 链表 存储 , 表 头 
指针 为 head ,要 求 在 第 i 个 元 素 之 前 插入 一 个 新 的 元 素 b。 设 p 为 指 . 
问 ai 的 直接 前 驱 结 点 a-: 的 指针 。 插入 时 ,首先 要 生成 -- 个 新 的 结 点 
由 s 指向 ,在 s 所 指 结 点 的 数据 域 中 存 人 .b, 再 令 s 结 点 的 的 指针 域 
指向 存储 元 素 ai 的 结 点 (由 p 和 .next 指向 ); 然 后 使 存储 元 素 a;_| 的 
结 扩 的 指针 域 (p 个. next) 指向 s。 线 性 链表 在 执行 插 人 操作 前 后 的 逻 
辑 状态 如 图 3-9 所 示 

这 种 插 人 操作 只 改变 了 两 个 结 点 的 指针 域 , 并 未 对 数据 元 素 作 
任何 移动 。 当 然 在 插入 之 前 首先 要 搜索 到 元 素 ai 的 直接 前 驱 结 点 ， 
并 判别 插入 位 置 是 否 合理 。 图 3-10 为 插入 算法 的 框图 描述 。 

如 下 是 线性 链表 插入 算法 的 PASCAL 语言 描述 。 
PROCEDURE ins-linklist (head ;pointer ;i,integer ;b ;elemtp); 
e。 39 。 
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(a) 插入 前 的 逻辑 状态 
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SA 
(b) 插入 后 的 逻辑 状态 


图 3-9 ”线性 链表 插入 操作 的 逻辑 状态 图 不 


设立 搜索 指针 (P: 二 head) 和 搜索 计数 器 (k= 二 0) 
(PZNIL) ANDGk<i—1) 
P<—P + .nextjk<-k 十 1 


组 织 循环 
搜索 ai--1 结 点 


EE 判别 插入 位 置 是 否 合理 


否 
产生 一 个 新 结 点 | | 输出 插入 位 置 
并 插入 到 链表 中 不 合理 信息 


图 3-10 ”线性 链表 插入 算法 的 框图 
VAR p,s : ponter; 
k : integer; 
BEGIN 
p: 一 head; k:=0; 
WHILE (p<>nil) AND (k<i—1) DO 
BEGIN p:=p .next; k:=k+1 END; 
IF (p=nil) THEN writeln (No this postion!’ ) 


e。 40。 


ELSE BEGIN 
new(s); s $4.data:=b; 
s 丰 .next: 一 D 不 .next; 
p 不 .next: 一 s 
end 


END 
三 、 线 性 链表 的 删除 


在 一 个 线性 表 (al,as,… ,as) 中 删除 第 1 个 元 素 。 者 线性 表 用 带 

头 结 点 的 线性 链表 存储 , 则 删除 第 i 个 元 素 (a;) 时 ,必须 改变 第 1 一 1 
个 元 素 (ai 的 直接 前 驱 元 素 a;_1) 结 点 的 指针 域 ,使 其 指 问 第 1 十 1 个 
元 素 (ai 的 直接 后 继 元 素 ai41) 的 结 点 ,然后 把 第 i 个 元 素 的 结 点 归还 
给 系统 。 设 p 为 指 问 元 素 a;_1 结 点 的 指针 ,gq 为 指向 元 素 a 结 点 的 指 
针 , 则 线性 链表 执行 删除 操作 前 后 的 逻辑 状态 如 图 3-11 所 示 : 

Head 了 q 
EE 

(a) 删除 前 的 逻辑 状态 

Head pF Ad 
证 i 


(b) 删除 后 的 逻辑 状态 


图 3-11 线性 链表 删除 操作 的 逻辑 状态 图 示 
同 插入 操作 一 样 , 在 这 里 也 不 需要 移动 数据 元 素 , 只 需要 搜索 到 
第 i 一 1 个 元 素 结 点 ,并 判别 删除 位 置 是 否 合理 ,然后 再 进行 删除 ,其 
算法 的 框图 描述 如 图 3-12 所 示 。 


、 循 环 链表 


循环 链表 是 线性 表 的 为 一 种 形式 的 链 式 存储 结构 , 它 与 线性 链 
表 的 不 同 之 处 在 于 :在 线性 链表 中 ,最 后 一 个 结 点 的 指针 域 为 “ 空 ” 
(nil) ; 而 在 循环 链表 中 最 后 一 个 结 点 的 指针 域 指向 头 结 点 ,使 整个 
链表 形成 一 个 环 。 所 以 ,从 表 中 任 一 结 点 出 发 都 可 以 找到 其 它 结 扣 。 


。 4]。 


| 设立 搜索 指针 (P: 一 head) 和 搜索 计数 器 (k: 一 0) | 


是 
PP+ .nextyk<k 十 1 


图 3-12 ”线性 链表 删除 算法 的 框图 
如 图 3-13 所 示 为 循环 链表 的 逻辑 状态 。 


Head Head 
号 ZE 站 :最 寸 


(a) 非 空 表 (b) 空 表 


图 3-13 带头 结 点 的 单 循环 链表 
在 循环 链表 上 的 操作 和 线性 链表 基本 一 样 ,差别 仪 在 于 表 尾 结 
点 的 判别 条 件 : 在 线性 链表 中 ,是 根据 结 点 的 指针 域 是 否 为 “ 空 ”Cnil) 
进行 判别 ; 而 在 循环 链表 中 ,是 根据 结 点 的 指针 域 是 否 指向 头 结 挟 
进行 判别 。 


五 、 双 向 链表 和 循环 双向 链表 


在 线性 链表 和 循环 链表 的 结 点 中 ,只 有 一 个 指向 直接 后 继 结 点 

的 指针 域 ,所 以 从 一 个 结 点 出 发 只 能 根据 指针 往 后 搜寻 其 他 络 氮 ,而 

不 能 直接 搜寻 结 点 的 直接 前 驱 结 点 。 若 要 寻找 一 个 结 点 的 直接 前 驱 ， 

则 需 从 头 指针 开始 搜寻 。 为 了 克服 线性 链表 单 向 性 的 缺点 ,人 们 提出 
»* 42 。 


了 双 回 链表 的 概念 。 
所 谓 双 各 链表 就 是 在 链表 的 每 个 | priou [ qata [ next | 
结 点 中 除了 设置 数据 域 以 外 ,再 有 两 个 
指针 域 ,其 一 和 单 链表 一 样 用 于 指向 直 “图 3-14 双向 链表 中 的 结 点 
接 后 继 结 点 , 另 一 个 则 用 于 指向 直接 前 驱 结 点 。 结 点 的 结构 如 图 3-14 
所 示 ; 
可 用 PASCAL 语言 描述 如 下 : 
TYPE dupointer = ‘ dunodetype; 
donodetype = 二 record 
data :elemtp; 
priou ,next :dupointer 
end; 
其 中 ,priou 为 指向 前 驱 结 点 的 指针 , 称 为 前 驱 指 针 ;next 为 指向 后 继 
结 点 的 指针 , 称 为 后 继 指 针 ,data 域 同 单 链 表 一 样 。 双 向 链表 的 逻辑 
状态 如 图 3-15 所 示 。 其 中 , 表 尾 结 点 的 后 继 指针 为 “空头 结 点 的 前 
驱 指 针 为 “ 空 "。 


Head Head 
[人 ^ 旷 二 [| [a 二 [| fa:^| 人才 = 人 陋 ^ 
(a) 非 空 表 (b) 空 表 


图 3-15 双向 链表 的 逻辑 状态 
在 双向 链表 中 , 播 和 人 操作 和 删除 操作 都 需要 同时 修改 两 个 方向 
上 的 指针 。 图 3-16 为 插入 操作 完成 前 后 有 关 结 点 的 指针 修改 情况 。 
其 中 ,新 插入 的 结 点 由 s 指向 , 结 点 插 在 元 素 ai 结 点 的 前 面 ,ai 结 点 
由 p 指向 。 


pF : pF 
a | 到 | 赴 |aa| 二 
加 
“9 


(a) 插入 前 (b) 插入 后 
图 3-16 ”双向 链表 插 人 操作 的 逻辑 状态 
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图 3-17 是 删除 操作 完成 前 后 有 关 结 点 的 指针 修改 情况 。 其 中 被 
删除 元 素 ai 的 结 点 由 Pp 指 问 。 


(a) 租 除 前 


pP 
{jd la) Lj: 


(b) 删除 后 


图 3-17 双向 链表 删除 操作 的 逻辑 状态 
在 双向 链表 中 执行 插入 操作 和 删除 操作 的 有 关 算 法 由 读者 目 己 
思考 ,要 注意 指针 域 修 改 的 先后 顺序 。 
同 单 链 表 类 似 , 双 向 链表 也 可 以 构成 循环 链表 ,并 称 为 循环 双 回 
链表 。 其 特点 就 是 表 尾 结 点 的 后 继 指 针 指 向 头 结 点 ; 头 结 点 的 前 驱 指 
针 指 向 表 尾 结 点 。 如 图 3-18 所 示 ,为 循环 双向 链表 的 逻辑 状态 。 


Head 


(b) 空 表 


图 3-18 ”循环 双向 链表 的 逻辑 状态 
在 循环 双向 链表 上 的 插入 操作 和 删除 操作 与 双向 链表 上 的 相应 
操作 类 似 。 


3.4 一 元 多 项 式 的 相 减 
在 这 一 小 节 中 ,我 们 以 一 元 多 项 式 相 减 问题 为 例 , 讨 论 有 关 线 性 
表 的 应 用 。 
一 、 一 元 多 项 式 的 表示 


在 数学 上 ,一 元 n 次 多 项 式 P.(x) 可 按 升 医 序 写成 ， 
P.(x) 一 po 十 Pi 关 X 十 十 Paxx 
它 由 mn 十 1 个 系数 唯一 确定 。 所 以 ,在 计算 机 中 ,可 以 用 一 个 线性 表 P 
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来 表示 ; 
P 王 (po, pi，…，pn) 
其 中 ,每 一 项 的 指数 i 隐 含 在 其 系数 p; 的 序号 中 (在 这 里 设 第 一 元 素 
的 序号 为 0) 。 显 然 ,我 们 可 以 对 了 采用 顺序 存储 结构 ,这 样 就 使 得 
多 项 式 相 减 算法 的 定义 十 分 简洁 。 例 如 ,假设 Q(x) 是 一 元 m 次 多 
项 式 ,同样 可 以 用 线性 表 Q 表示 : 
Q= (qo,q1,"" ,qn) 
不 失 一 般 性 , 设 m<n, 则 多 项 式 P,(x) 减 Qs。(x) 的 结果 R,(x)==P。 
(x) 一 Q(x) 可 用 线性 表 R 表示 : 
R= (po 一 qo,pl 一 qi pa 一 gmypa+ly ypn) 
至 此 我 们 可 以 看 出 ,一 元 n 次 多 项 式 的 这 种 表示 很 明确 ,操作 也 
很 方便 .但 是 ,在 实际 应 用 中 ,多 项 式 的 寡 次 数 可 能 很 高 ,并 且 许多 系 
数 可 能 为 零 ; 所 以 使 用 这 种 表示 方法 ,在 线性 表 中 必然 存在 许多 和 零 元 
素 ,将 它们 存放 在 内 存 中 必然 浪费 空间 。 例 如 :有 一 多 项 式 S(x): 
z S(x)==] 十 3x! 一 2x 
则 它 的 线性 表 长 度 为 2001。 其 中 , 零 元 素 有 1998 个 ,而 非 零 元 素 只 
有 3 个 。 对 这 个 线性 表 , 不 管 采用 顺序 存储 结构 还 是 链 式 存储 结构 ， 
都 将 造成 内 存 空间 的 极 大 浪费 。 为 此 ,我 们 设想 用 男 外 一 种 二 元 组 
(一 个 元 素 有 两 个 数据 项 ) 的 形式 表示 多 项 式 , 使 之 只 保存 非 零 系 数 
项 。 当 然 ,此 时 必须 同时 保存 非 零 系数 以 及 相应 的 指数 。 
一 般 情 况 下 ,一 元 n 次 多 项 式 P,(x) 可 写成 : 
P(x)=pix" 十 pox*? 十 …* 十 pmX™ 
其 中 ， pi 一 >>0(G 王 1…m),0 和 el<e…<en 一 n。 可 以 用 一 个 线 
性 表 表 示 这 样 的 多 项 式 : 
((plyel),， (pyez)，…，(pmnyen)) 
其 中 ,每 个 元 素 有 两 个 数据 项 (系数 ,指数 )。 
这 种 表示 方法 ,在 最 坏 情况 下 n 十 1 个 系数 都 不 为 0, 此 时 上 面 
的 方案 要 比 前 一 方案 多 存储 一 倍 的 数据 。 但 是 ,对 于 S(x) 这 类 多 项 
式 , 则 这 种 表示 将 大 大 节省 内 存 。 . 
当然 ,对 于 这 个 线性 表 , 可 以 用 顺序 存储 结构 存储 (如 图 3-19 所 
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示 ), 也 加 以 用 链 式 存 储 结构 存储 。 如 图 
3-20 所 未 。 | 
它们 的 PASCAL 语言 描述 分 别 为 ; 
TYPE elemtp = RECORD 


coef ,real; 
3-19 ”多项式 二 元 组 线性 exp :integer; 
表 的 顺序 存储 结构 END; 


polynty 一 ARRAYL1..mj] OF elemtp; 
Head 


YY jt + oder A] 


图 3-20 ”多项式 二 元 组 线性 表 的 单 链表 存储 结构 
这 是 顺序 存储 结构 的 描述 。 其 中 ,二 元 组 (coef,exp) 分 别 表示 系数 和 
指数 。 
TYPE polylink = 不 nodetp; 
nodetp = RECORD 
coef ;real; 
exXp :Integer; 
next ;polylink ; 
END; 
这 和 古 单 链表 存储 结构 的 结 点 描述 。 

在 实际 应 用 中 ,究竟 采用 哪 一 种 存储 结构 , 则 要 根据 具体 的 应 用 
而 定 。 例 如 , 求 多 项 式 的 值 , 在 运算 过 程 中 只 需 访 问 多 项 式 的 系数 和 
指数 , 则 选择 顺序 存储 结构 为 宜 ; 又 如 求 两 个 多 项 式 的 和 、 差 , 积 等 运 
算 , 则 由 于 在 执行 加 法 ,减法 .乘法 等 操作 时 , 非 零 系数 会 经 常 修改 ， 
线性 表 要 经 常 进 行 插 人 和 删除 操作 ,所 以 应 采用 链 式 存储 结构 为 宜 。 
下 面 我 们 将 在 带头 结 点 的 线性 链表 上 讨论 两 个 一 元 多 项 式 的 减法 运 
算 。 


二 、 多项式 相 减 运算 


两 个 一 元 多 项 式 相 减 , 运 算 规则 很 简单 :对 于 两 个 多 项 式 中 指数 
相同 的 项 ,其 相应 的 系数 相 减 ， 奉 差 不 为 零 , 则 构成 “ 差 多 项 式 ” 中 的 
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一 项 ;对 于 在 彼 减 多 项 式 中 存在 而 在 减 数 多 项 式 中 不 存在 的 项 ,直接 
复 抄 到 “ 差 多 项 式 ” 中 ;对 于 在 减 数 多 项 式 中 存在 而 在 被 减 多 项 式 中 
不 存在 的 项 , 则 需要 改变 系数 符号 后 ,加 到 ”“ 差 多 项 式 ” 中 。 

在 这 里 以 奏 涉 结 点 的 线性 链表 作为 存储 结构 ,并 且 结 果 多 项 式 
保留 在 被 减 多 项 式 上 , 且 不 改变 威 数 多 项 式 的 线性 链表 。 例 如 ,有 两 
个 一 元 多 项 式 : 

A(x)= 二 5 十 3x 十 9x' 十 5x" 

BCx) 王 4x 十 9x 一 8x: 
要 求 计算 A'(x) 一 A(x) 一 B(x)。 图 3-21 是 A(x)、B(x) 的 线性 链表 
仓储 结构 。 


Hb 


[二 万 -=[4[1 [十 ~[9[6[ 寺 ~[=s[sIA 


图 3-21 多 项 式 A(x)、.B(x) 的 线性 链表 
傻 设 两 个 线性 链表 的 头 指针 分 别 为 ha、.hb。 为 了 实现 两 个 多 项 式 相 
减 运算 ,需要 设立 两 个 搜索 指针 pa 和 pb 分 别 指向 当前 被 检测 的 结 
点 (开始 时 pa :一 ha4+ .next;pb: 一 hb 人 .next)。 则 相 减 的 步骤 可 概括 
为 ;依次 取 A(x)、B(x) 中 的 结 点 进行 比较 ,并 根据 比较 结果 执行 下 
面 操作 ; 
1. 大 pa 一 nil 或 pa 人 .exp 盖 pb 人 .exp, 则 需 在 A 表 的 表 尾 或 pa 
结 点 的 前 面 插 入 一 个 系数 为 一 pb 个 .coef .指数 为 pb 个 .exp 的 结 点 。 
然后 pb 向 后 推进 一 步 (pb: 二 pb 个 .next) ,pa 不 变 。 
2. 苍 pa 二 之 nil 并 且 pa 个 .exp 二 pb 个 .exp, 则 
当 pa 个 .coef 一 pb 个 .coef 志 守 0 时 ,需要 修改 pa 个 .coef (pa^. 
coef :一 pa 个 .coef 一 pb 个 .coef), 且 pa、pb 同时 向 后 推进 一 步 (pa: 二 
pa 人 .nextypb :一 pb 个 .next) 。 
当 pa 个 .coef 一 pb 个 .coef 二 0 时 , 需 把 pa 结 点 删除 , 旦 pa、pb 同 
时 向 后 推进 - 步 。 
3. 奋 pa 忆 之 ni 并 且 pa 个.exp 过 pb 个 .exp 则 只 需 pa 向 后 推进 
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一 步 。 如 此 直到 B(x) 的 非 零 系 数 都 被 运算 过 ( 即 pb 一 nl) 。 

由 于 在 运算 中 需要 在 pa 前 插入 结 点 或 删除 pa 结 点 ,所 以 需 修 
改 pa 的 前 驱 结 点 的 指针 域 ,为 此 还 需 设立 一 个 辅助 指针 qa 以 指示 
pa 的 前 驱 结 点 。 图 3-22 是 多 项 式 相 减 算法 的 框图 描述 。 


指针 初始 化 : 
Pa<—ha .next;Pb<—hb .next; 
qa<—ha; 


下 | 
< pb=Ni > 
(Pa=NiDor(pat .exp>pb¢t.exp 四 否 pa.exp<pb .exp(pa Nil) 


比较 pa 不 .exp 和 pb 人 .exp 


pa 个 ,exp 二 pb 不 ,exp(pa 关 Ni) 


pa 向 右 推进 一 步 


产生 一 个 新 结 点 S 
且 S+ .coef= 一 pb 
.coef 然 后 把 S 插 
人 到 qa 的 后 而 ,再 
把 qa,pb 向 右 推进 


一 步 
删除 Pa 结 点 Pa， 修改 Pa + . coefPa， 
Pb 疝 右 推进 一 步 Pb 向 右 推 进一步 


图 3-22 ”多 项 式 相 减 算法 框图 
该 算法 的 PASCAL 语言 描述 如 下 : 
PROCEDURE ploysub (VAR ha:ploylink;hb:ploylink); 
VAR pa,pb,qa,s:ploylink; 
BEGIN 


pa:=ha‘ 人 .next; pb:=hb‘ 人 .next; qa:=ha; 
WHILE pb=<>nil DO 
IF (pa 一 nil) OR (pa 人 .exp 之 pb 个 .exp) 
THEN BEGIN 
new(s);s4.coef :一 一 pb 人 .coefy sf+.exp: 一 pb 个 .expj 
ss 人 .next:=pa; qa 人 .next:=s; 
qa :一 S; pb; =pb 人 . next 
Ey 


END 
ELSE 
IF pa + .exp 一 pb 个 .exp 
THEN BEGIN 
pa 4 . coef :一 pa 人 .coef 一 pb 人 .coef; 
IF pa 人 .coef 一 0 

THEN BEGIN 
qa 人 .next:=pa 人 .next; 
dispose (pa); 
pa :一 qa 个 .next; 
pb :一 pb 人 .next 
END 

ELSE BEGIN 
qa: 一 pai pa: 一 pa 不 .nexti 
pb :一 pb 个 .next 

END 
END 
ELSE BEGIN 
qa: 一 paji pa: =—=pa‘.next 
END 
END; 
假设 多 项 式 A(x) 中 有 m 项 ,B(x) 中 有 n 项, 则 这 个 算法 的 时 间 
复杂 度 为 OCm 十 n)。 


习 题 


1. 试 分 别 以 顺序 存储 结构 和 链 式 存储 结构 实现 线性 表 的 就 地 
倒置 算法 ， 即 在 原 表 的 存储 空间 内 将 线性 表 (ai,as,…,an) 倒 
置 为 (a, ,an_1,… ,al)。 

2. 设 有 两 个 线性 表 X= (x Xx Xn) Y= (yy ym)。 试 
写 一 合并 X,Y 为 线性 表 Z 的 算法 , 使 得 : 
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7 BS A LL J OR RD 当 m<=n; 

(RIV YY i 当 m>n; 
要 求 XY,Z 用 链表 存储 , 并 且 2Z 表 利 用 X 和 YY 中 的 结 点 空 
间 。 


. 写 一 个 算法 , 求 出 线性 表 中 数据 域 的 值 为 x 的 结 点 序号 。 序 


号 从 表 头 算 起 , 若 链表 中 没有 此 结 点 则 序号 为 零 。 


. 试 以 循环 链表 作为 稀 朴 多 项 式 的 存储 结构 ,编写 求 其 导 函 
数 的 算法 ,要求 利用 原 多 项 式 的 结 点 空间 存放 结果 多 项 式 


第 四 日 栈 和 队列 


栈 和 队列 是 两 种 重要 的 线性 结构 ,它们 在 各 种 软件 系统 中 被 广 
泛 的 应 用 。 从 数据 结构 角度 看 , 栈 和 队列 也 是 线性 表 , 数 据 元 素 之 间 
存在 线性 关系 ,只 是 栈 和 队列 的 基本 操作 是 线性 表 的 子 集 ,它们 是 操 
作 受 限 的 线性 表 。 本 日 将 主要 讨论 栈 和 队列 的 定义 、 表 示 方 法 及 应 
用 。 


4.1 栈 


一 、 栈 的 定义 


所 谓 栈 就 是 限定 仅 在 表 的 同一 端 进行 插入 数据 元 素 ( 和 人 栈 操作 :) 
或 删除 数据 元 素 ( 出 栈 操作 ) 的 线性 表 。 人 允许 插入 数据 元 素 和 删除 数 
据 元 素 的 一 端 称 为 栈 顶 (top), 而 表 中 国定 的 一 端 称 为 栈 底 
《bottom)。 不 含 任何 元 素 的 栈 称 为 空 栈 。 z 

假设 有 个 栈 S 二 (al,as，,…,as), 则 a 为 栈 底 
元 素 ,an 为 栈 顶 元 素 。 由 于 栈 只 允许 在 栈 顶 进行 
播 人 和 删除 元 素 ;所 以 它们 进 栈 的 次 序 为 aly32?， 
… ax 而 出 栈 的 次 序 为 aayan -1,…，al。 可见 栈 的 
操作 是 按 后 进 先 出 的 原则 进行 的 ,如 图 4-1 所 
示 。 因 此 , 栈 又 称 为 后 进 先 出 (Last in First out) 
的 线性 表 ( 简 称 LIFO 表 ) ,在 日 常生 活 中 有 许多 ee 
类 似 于 栈 的 例子 。 例如 在 桌子 上 有 一 爸 碗 ,规定 | 
每 次 只 能 放 一 只 碗 在 上 面 , 并 且 放 在 这 要 碗 的 项 上 ;每 次 只 能 取 一 只 
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碗 ,并 且 从 这 笃 碗 的 项 上 拿 。 这 就 很 类 似 于 栈 , 放 碗 时 相当 于 人 栈 操 
作 , 取 碗 相当 于 出 栈 操作 。 


二 、 栈 的 基本 操作 


栈 的 基本 操作 除了 插入 (入 栈 ) 操 作 和 删除 (出 栈 ) 操 作 外 ,还 有 
栈 的 初始 化 .判定 栈 空 和 取 栈 顶 元 素 等 。 
1. 初始 化 (inistack(S)): 设 定 S 为 一 个 空 栈 。 
2， 判 栈 空 (empty(S)): 若 栈 S 为 空 , 则 返回 值 TRUE; 和 否则 返 
回 值 FALSE。 
3. 人 栈 (Cpush(S,x)): 把 元 素 x 插入 到 栈 s 的 栈 顶 。 
4. 出 栈 (pop(S)); 车 栈 S 不 空 时 ,把 栈 顶 元 素 弹 出 ,并 返回 其 
值 ; 否则 返回 一 个 “ 空 ? 值 。 
5. 取 栈 顶 元 素 (gettop(S)): 当 栈 S 不 空 时 返回 栈 顶 元 素 值 ; 否 
则 返回 “ 空 " 值 ,注意 它 和 出 栈 操作 的 区 别 在 于 它 不 弹出 栈 顶 
元 素 。 
三 、 栈 的 存储 结构 


栈 的 存储 结构 同 线性 表 一 样 有 两 种 :顺序 存储 和 链 式 存 储 , 下 面 
将 分 别 介 绍 。 

1. 栈 的 顺序 存储 结构 

栈 的 顺序 存储 结构 就 是 用 一 组 连续 的 存储 单元 依次 存放 自 栈 底 
到 栈 顶 的 数据 元 素 , 同 时 设立 指针 top( 称 为 栈 顶 指针 ) 以 指示 栈 顶 元 
素 的 当前 位 置 .假设 用 一 维 数 组 SL1. . arrmax 表示 栈 , 则 当 top 王 ar- 
rmax 时 表示 栈 满 , 此 时 若 有 元 素 人 栈 则 将 产生 “数组 越界 ?的 错误 称 
之 为 上游”; 反 之 , 当 top 二 0 时 表示 栈 空 , 此 时 若 要 进行 元 素 出 栈 操 
作 则 也 将 产生 “数组 越界 ?的 错误 称 之 为 "下 溢 ”。 图 4-2 表示 了 栈 顶 
指针 同 栈 中 元 隶 之 间 的 关系 。 
在 PASCAL 语言 中 ,可 以 用 如 下 定义 描述 栈 的 顺序 存储 结构 : 

- 'CONST arrmax 一 ( 栈 中 允许 存放 元 素 的 最 大 数 ); 
TYPE sqstktp 王 RECORD 
e。 D9。 


elements : ARRAY [1..arrmax | OF elementype; 
top : 0..arrmax 


END:; 


(a) 空 本 (b》 栈 中 有 一 个 元 素 A (c) 栈 满 〈d) 在 (c) 时 弹出 栈 顶 元 素 


图 4-2 栈 项 指针 与 栈 中 元 素 的 关系 

其 中 ,数据 域 elements 描述 了 栈 的 存储 空间 ,数据 域 top 为 栈 项 指 
针 。 在 这 种 存储 结构 上 , 栈 的 五 种 基本 操作 都 很 容易 实现 , 下面 直 接 
给 出 它们 的 PASCAL 语言 描述 。 

PROCEDURE nistack (VAR s:sqstktp); 

BEGIN 

s,top :一 0 
END ; 


FUNCTION push(VAR s:sqstktp; x:;elementype) ; boolean ; 
BEGIN 
IF s. top=arrmax 
THEN return (FALSE) 
ELSE BEGIN 
s. top :一 S.topb 十 1; 
s. elements[s. top ] : 一 x; 
return (TRUE) 
END 
END; 


FUCTION pop(VAR s:sqstktp) :; elementype; 
BEGIN 
IF s.top=0 
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THEN return (NULL) 
ELSE BEGIN 
$. top: =s,. top—1]; 
return (s. elements[s. top 十 1]) 
END 
END:; 


FUCTION empty(s:sqstktp) :bootean ; 
BEGIN 
IF «. top=:0 
THEN return (TRUE) 
ELSE return (FALSE) 
END; 


FUNCTION gettop(s:sqstktp) :elementype; 
"BEGIN 
JP s. top=0 
THEN return (NULL) 
ELSE return(s. elements[s. top ]) 


i 四 在 实际 工作 中 , 栈 的 应 用 非常 广 
| {| 由。 泛 , 特 别 是 在 一 些 大 型 软件 系统 中 ， 
往往 会 同时 使 用 多 个 栈 。 当 然 , 这 时 
图 4-3 ”两 个 栈 共享 空间 示意 图 ”可 以 为 每 一 个 栈 安排 一 个 数组 ,但 这 
样 做 并 不 实际 。 因 为 各 个 栈 的 实际 
使 用 空间 在 使 用 期 间 是 不 断 变化 的 ,常常 会 有 这 样 的 情况 :其 中 某 一 
栈 “ 上 洲 ” 时 ,而 另外 的 栈 还 有 许多 的 空闲 空间 。 所 以 ,如 果 能 使 多 个 
栈 共享 空间 , 则 将 提高 空间 的 使 用 效率 ,从 而 减少 发 生 栈 的 “上 溢 ?”。 
例如 在 实际 应 用 中 需要 设立 两 个 栈 时 ,可 以 使 它们 共享 一 维 数 
组 空间 s[L1,.arrmaxj, 两 个 栈 的 栈 底 分 别 设 在 数组 的 两 端 。 人 栈 操 
作 时 都 向 中 间 延 伸 , 仅 当 两 个 栈 的 栈 顶 指针 在 中 间 相 和 遇 时 才 发 生 “ 上 
洲 ”, 如 图 4-3 所 示 。 
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从 中 可 以 看 出 ,由 于 两 个 栈 之 间 的 存储 空间 可 以 互补 ,使 得 每 个 栈 实 
际 可 利用 的 最 大 空间 大 于 arrmax/2。 当 在 实际 应 用 中 需要 设立 多 个 
栈 时 ,也 可 以 使 它们 共享 一 个 数组 ,但 操作 要 比 刚才 复杂 一 些 ,此 时 


最 好 采用 下 面 介绍 的 链 式 存储 结构 。 
2. 栈 的 链 式 存储 结构 Pe re 
对 于 一 个 栈 , 我 们 也 可 以 用 一 个 线性 链 
表 作为 存储 结构 。 用 链表 表示 的 栈 简称 为 链 
栈 , 其 逻辑 结构 如 图 4-4 所 示 。 : 
其 中 ,top 为 栈 顶 指针 。 可 用 PASCAL 语言 
作 类 型 说 明 如 下 : 
TYPE linkstack = 4 stknode; 4-4 链 栈 示意 图 


stknode 一 RECORD 

data :elemtype:; 

next :linkstack 

END:; 
对 于 链 栈 , 当 top 二 nil 时 表示 栈 空 ;而 栈 满 的 情形 只 有 当 计算 机 系统 
中 的 可 利用 空间 都 被 占用 时 才 会 发 生 。 所 以 多 个 链 栈 要 么 同时 发 生 
栈 满 情形 ;而 不 会 发 生 其 中 之 一 栈 满 ,而 其 它 栈 有 空闲 空间 的 情形 。 
显然 ,多 个 链 栈 共享 空间 也 就 是 自然 而 然 的 事 了 。 对 于 链 栈 来 说 , 栈 
的 基本 操作 是 很 容易 实现 的 ,读者 可 自行 完成 之 。 


4.2 队 列 


一 、 队 列 的 定义 


队列 是 限定 在 表 的 一 端 进 行 插入 数据 元 素 ( 和 人 队 操 作 )、 在 表 的 
另 一 端 进行 删除 数据 元 素 ( 出 队 操作 ) 的 线性 表 。 其 中 ,允许 插入 的 一 
端 称 之 为 队 尾 (rear), 允许 删除 的 一 端 称 之 为 队 头 (front) 。 当 队列 中 
不 含 任何 数据 元 素 时 称 为 空 队 列 。 
假设 有 一 个 队列 Q= (al,as，…，,an), 则 ai 称 为 队 头 元 素 ,an 称 为 
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出 队列 一 一 al| az| … ao| 一 一 人 队列 | 队 尾 元 素 。 元 素 人 队 的 次 序 
为 alyaz，…，an, 出 队 的 次 序 


图 4-5 队列 示意 图 也 为 a1,as,…,as。 可 见 队 列 
的 操作 是 按 先进 先 出 原则 进行 的 ,如 图 4-5 所 示 。 因 此 ,队列 又 称 为 
先进 先 出 (First in First Out) 的 线性 表 ( 简 称 为 FIFO 表 ) 。 这 就 如 同 
日 常生 活 中 排队 买 东 西 一 样 ,最 早 进入 队列 的 最 先 买 到 东西 离开 队 
列 。 


二 、 队 列 的 基本 操作 


队列 的 基本 操作 同 栈 类 似 , 也 有 五 种 ,不 同 的 是 删除 数据 元 素 是 
在 队 头 进行 。 

1. 初始 化 (iniqueue(Q)): 设 定 Q 为 一 个 空 队列 。 

2， 判 队列 空 (empty(Q)): 判别 队列 Q 是 否 为 空 。 若 队列 为 空 
则 返回 值 TRUE; 否 则 ,返回 值 FALSE。 

3， 人 队列 (enqueue(Q,x)): 把 数据 元 素 x 插入 到 队列 Q 的 队 
尾 。 

4. 出 队列 (delqueue(Q)): 车 队列 Q 不 空 , 则 把 队 头 元 素 删除 ， 
并 返回 其 值 ; 否 则 , 返回 一 个 “ 空 ” 值 。 

5. 取 队 头 元 素 (gethead (Q)): 车 队列 Q 不 空 , 则 返回 队 头 元 
素 ; 否 则 ,返回 一 个 “ 空 ? 值 。 


三 、 队 列 的 存储 结构 


1. 队列 的 顺序 存储 结构 一 一 循环 队列 

同 栈 的 顺序 存储 结构 类 似 , 在 队列 的 顺序 存储 结构 中 ,需要 用 一 
组 连续 的 存储 单元 依次 存放 自 队 头 到 队 尾 的 数据 元 素 , 并 且 还 需 设 
立 两 个 指针 分 别 指示 队 头 元 素 和 队 尾 元 素 。 在 此 约定 : 队 尾 指针 指示 
队 尾 元 素 在 队列 中 的 当前 位 置 , 队 头 指针 指示 队 头 元 素 的 前 一 个 位 
置 。 在 PASCAL 语言 中 可 用 如 下 的 类 型 定义 描述 队列 的 顺序 存储 结 
构 

CONST maxsize 二 {队列 的 最 大 容量 }; 
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TYPE cyclicquetp = RECORD 
elements :array[ 0. . maxsize— 1 | OF elementype; 
rear ,front :0.. maxsize—1; 
END:; 
其 中 ,rear 和 front 分 别 表示 队 尾 和 队 头 指针 ,elements 为 存储 队列 
元 素 的 向 量 。 图 4-6 展示 了 在 队列 的 顺序 存储 结构 中 数据 元 素 和 队 
头 、 队 尾 指针 的 关系 。 


5 Bl | 5 | F | 
4 4 | 4 4 下 | 
: sq. rear wk es : sq. zone 一 一 
1 Ba Tont 上 
0 : :| 0 of | 
sq, rear sq. front 
Won (b) (c) (d) 

(a) 空 队列 (b) 元 素 A,B,C 相 继 插 人 队列 


(c) 元 素 A,B,C 相 继 出 队列 (d) 元 家 D,E,F 入 队列 


图 4-6 ”队列 顺序 存储 结构 中 队 头 、 队 尾 指 针 与 元 素 的 关系 
从 中 可 以 看 出 ,队列 为 空 时 , 队 头 与 队 尾 指针 之 间 存 在 如 下 关系 ( 设 
sq 为 cyclicquetp 变量 ) : 
sg. front 一 sq. rear 

如 图 4-6 中 (a) 和 (c) 所 示 的 情况 。 在 队列 的 顺序 存储 结构 中 ,需要 讨 
论 的 是 队列 满 ( 上 洲 ) 的 判定 条 件 是 什么 ? 在 图 4-6(d) 中 队 尾 指针 已 
指向 向 量 的 上 界 。 若 要 进行 人 队 操 作 (sq. rear :一 sq. rear 十 1; sq. ele- 
ments[sq. rear] :一 x) 必然 发 生 上 滋 ” 但 实际 上 向 量 中 还 有 三 个 空 
的 存储 单元 。 这 种 现象 称 之 为 “ 假 洲 出 ”。 对 于 这 一 问题 ,可 以 用 下 面 
两 种 方法 解决 :其 一 是 当 发 生 “ 假 溢出 ?时 ,将 全 部 元 素 向 前 移动 ,使 
队 头 元 素 存 放 在 向 量 下 界 的 位 置 ,当然 ,移动 元 素 需 要 花费 一 定 的 时 
间 ; 其 二 是 把 存储 队列 元 素 的 向 量 elements[0.. maxsize 一 1] 看 成 一 
个 循环 表 (elements{ 0] 接 在 elements[maxsize 一 1 | 的 后 面 ), 这 种 队列 
称 为 循环 队列 ,使 用 比较 方便 。 图 4-7 为 循环 队列 的 示意 图 。 

在 循环 队列 中 ,入 队 操 作 可 以 如 下 描述 (不 考虑 上 洲 ): 

sq. rear :一 (sq. rear+1) MOD maxsize; 
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Q. rear 
maxsize—1 


2 QOD 


Q. front < 


(a) - - 般 情 况 (b) 空 队 列 《c) 满 队列 


图 4-7 循环 队列 示意 图 
sq. elements[sq. rear |: =x; 
出 队 操 作 可 以 简单 地 如 下 描述 : 
sq. front : = (sq. front 十 1) MOD maxsize; 

在 循环 队列 中 ,虽然 很 巧妙 地 解决 了 “ 假 上 洲 ” 的 问题 。 然 而 , 随 

之 又 产生 了 一 个 新 的 问题 一 一 如 何 判 别 队 列 空 和 队列 满 ? 
假设 当前 状态 为 图 4-7(a) 所 示 , 现 
Co, 有 三 个 元 素 D.E、F 入 队列 ,使 队列 旺 
0 一 - Q.rear 满 的 状态 。 此 时 ,q. front 王 q. rear, 如 图 
CaT > 4-7(c) 所 示 。 假 设 在 图 4-7(a) 所 示 状态 
| 时 ,A、B、C 三 个 元 素 相 继 出 队列 , 则 队 
列 呈 空 状态 ,如 图 4-7(b) 所 示 , 此 时 也 
有 q.front 二 q. rear。 由 此 可 见 , 只 赁 q. 
front 一 q. rear 还 不 能 判定 循环 队列 是 
空 还 是 满 ,对 于 这 个 问题 我 们 可 以 用 这 样 的 方法 解决 :队列 仍然 设 头 
指针 和 尾 指针 ,并 且 当 q. front 二 q. rear 时 表示 队列 空 ; 只 是 将 队列 
满 的 判别 条 件 约定 为 (gq. rear 十 1) MOD maxsize = 9q. front。 也 就 是 
说 , 当 执 行人 队 操 作 时 , 队 尾 指针 从 后 面 赶 上 队 头 指针 就 认为 队 满 ， 

发 生 上 滋 ”。 图 4-8 就 是 队 满 示意 图 。 

在 这 里 可 以 看 到 头 指 针 所 指示 的 存储 单元 永远 是 空 亲 的。 当然， 
对 于 队 满 和 队 空 的 判别 也 可 以 通过 另外 设立 一 个 标志 进行 ,但 这 样 
做 操作 时 就 要 多 花 一 些 时 间 。 

和 


QQ. front 


图 4-8 队 满 示意 图 


- 采用 上 述 存储 结构 ,队列 的 基本 操作 都 很 容易 实现 .下 面 仅 就 出 
队 和 入 队 操 作 给 出 框图 描述 和 PASCAL 语言 描述 。 见 图 4-9 及 图 
4-10。 


元 素 插 人 到 队 尾 返回 < 上 滋 ? 信 息 


《结束 ) 


图 4-9 循环 队列 人 队 操 作 的 算法 框图 
FUNCTION en-cyque(VAR q:cyclicquetp; x:elementype) :boolean; 
BEGIN 
IF (q. rear 十 1)》 MOD maxsize 一 q. front 
THEN return (FALSE) 
ELSE BEGIN 
q. rear: = (gq, rear 十 1) MOD maxsize; 
q. elements[g. rear ]: =x 
END 
END; 


而 陈 队 闫 元素 开 
且 返 回 其 值 


图 4-10 循环 队列 出 队 操 作 的 算法 框图 
FUNCTION dl-cyque(VAR q:cyclicquetp) :elementype; 
BEGIN 
IF q. rear 一 q.front 
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THEN return (NULL) 
ELSE BEGIN 
q. front :一 (q. front+1) MOD maxsize; 
return(q. elements[ gq. front ]) 
END 
END; 
2. 队列 的 链 式 存储 结构 
队列 和 栈 一 样 ,需要 经 常 进行 插入 和 删除 操作 ,所 以 数据 元 素 的 
变动 较 大 。 为 此 ,用 链 式 存储 结构 比 顺序 存储 结构 更 为 合适 。 用 链表 
表示 的 队列 简称 为 链 队 列 。 


绪 寺 {* [jj-[* [二 一 [A 隐 


to. front Q. rear 


. front Q. rear 


(a) 非 空 链 队 列 \b) 空 链 队列 


图 4-11 链 队列 示意 图 
在 链 队列 中 ,用 一 个 带头 结 点 的 单 链 表 存 储 队列 元 素 , 并 设置 两 
个 指针 ( 头 指针 和 尾 指针 ) 分 别 指向 头 结 点 和 队 昆 结 点 ; 当 队 列 为 空 
时 , 头 指针 和 尾 指针 均 指 向 头 结 点 。 其 逻辑 结构 如 图 4-11 所 示 , 其 
PASCAL 语言 的 类 型 定义 如 下 : 
TYPE queueptr 一 人 queuenode; 
queuenode 王 了 RECORD 
data :elementype ; 
next :queueptr 
END; 
linkquetp 王 RECORD 
front ,rear :queueptr 
END; 
在 链 队 列 上 ,队列 的 基本 操作 也 很 容易 实现 。 下 面 对 初 始 化 、 入 
队 、 出 队 操作 给 出 其 算法 的 PASCAL 语言 描述 。 
PROCEDURE init-linkque(VAR 9q:linkquetp); 
BEGIN 
ncw(q. front); q. rear: 9. front; q. front 不 . next :一 nil; 
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END; 


FUNCTION en 一 linkque(VAR q:linkquetp; x:elementype) :boolean; 
BEGIN 

new(q. rear 个. nexty); 

q. rear : 一 q. rear ‘4 .next; 

q. rear 和 .data: =x; 


qd. rear $4 .next: =nil; 


END; 


FUNCTION di—linkque(VAR q:linkquetp) :elementype; 
VAR s:dueueptr; 
x:clementype; 
BEGIN 
IF q. front 王 q. rear 
THEN return (NULL) 
ELSE BEGIN 
s:;=q. front .next; 
q. front 人 .next;=s 人 .next; 
IF sf .next 一 nl THEN q. rear :一 q. front; 
x:=S4, data; dispose(s); 
return (x) 
END 
END:; 
链 队 列 同 链 栈 的 情况 相同 ,一 般 情况 下 不 会 发 生 “ 上 溢 ” 现 象 . 除 
非 是 整个 系统 的 可 利用 空间 都 被 占 满 。 


4.3 算术 表达 式 的 计算 


算术 表达 式 的 计算 是 程序 设计 语言 编译 中 的 一 个 最 基本 的 问 
题 ; 它 的 实现 是 栈 应 用 的 典型 例子 。 在 这 里 介绍 一 种 简单 直观 三 为 
使 用 的 算术 表达 式 的 计算 算法 一 一 算 符 优先 算法 。 
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要 把 一 个 算术 表达 式 翻 译 成 能 正确 求 值 的 一 组 机 器 指令 序列 ， 
或 者 直接 对 表达 式 进 行 计 算 求 值 , 首 先 要 能 够 正确 解释 表达 式 。 例 
如 ,对 下 述 算术 表达 式 求 值 : 

4 十 5x* (6 x 2)/4 
首先 要 知道 算术 运算 的 规则 :(1). 先 乘 除 、 后 加 减 ;(2). 先 括号 内 后 
括号 外 ;(3). 从 左 算 到 右 。 因 此 这 个 算术 表达 式 的 计算 顺序 为 : 
4 十 5x* (6 十 2)/4= 二 4 十 5* 8/4 一 4 十 40/4 王 4 十 10 一 14 
算 符 优先 算法 就 是 根据 这 个 运算 规则 来 实现 对 算术 表达 式 的 编译 或 
计算 。 

任何 一 个 算术 表达 式 都 是 由 操作 数 ,运算 符 和 界 符 组 成 。 在 这 里 
为 了 叙述 的 简洁 ,我 们 仅 讨 论 一 种 简单 算术 表达 式 的 求 值 . 这 种 表达 
式 中 只 含 加 , 减 、. 乘 、 除 四 种 运算 符 , 界 符 为 左右 括号 ,操作 数 为 整数 。 
我 们 把 运算 符 和 界 符 统 称 为 算 符 .根据 上 述 三 条 运算 规则 ,在 运算 的 
每 一 步 中 ,任意 两 个 相继 出 现 的 算 符 OP 和 OP; 之 间 的 优先 关系 至 
多 为 下 面 三 种 关系 之 一 ; 


OP,<OP， 表示 OP 的 优先 权 低 于 OP， 
OP, 一 OP， 表示 OP 的 优先 权 等 于 OP， 
OP>OP; 表示 OP 的 优先 权 高 于 OP， 


表 4-1 定义 了 算 符 之 间 的 这 种 优先 关系 。 
表 4-1 算 符 之 间 的 优先 关系 


6 + — * / ( ) # 


全 ~ 人 入 1-|~-|~ 
~ 人 ~ _ ~ ~ ~ ~ AL 
AAA _ 人 ~~ ~ ~ 人、 -~ 
个 ~ ~ ae ww ~ 

~ ~ _ Bf 


《 生 
具体 实现 时 ,在 表达 式 的 开始 和 结束 之 处 各 设置 一 个 井 号 ”并 ”， 
构成 整个 表达 式 的 一 对 括号 。 根 据 运 算 规 则 .2,OPi 为 十 .一 、* 、/ 
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时 ,OP,<(;OP,) 。 例 十 <(。 根 据 运算 规则 3,OP; 和 OP; 同时 为 十 、 
一 或 同时 为 * 、 /时 ,OP,>OP:.。 例 十 > 十 ;一 > 十 ;/ > x* /等 。 在 
表 中 , (二 =) 表示 左 右 括号 相 吉 ,括号 内 的 运算 已 经 完成 ; 同 理 , 检 二 # 
表示 整个 算术 表达 式 运 算 结 束 。) 与 (、# 与 ) 以 及 (与 六 之 间 无 优先 权 
关系 ,表示 在 算术 表达 式 中 不 允许 它们 相继 出 现 。 如 果 出 现 这 种 情 
况 , 则 表示 这 个 表达 式 不 正确 。 在 下 面 讨论 中 ,假设 算术 表达 式 的 形 
式 是 正确 的 。 

编译 程序 对 算术 表达 式 使 用 算 符 优先 算法 进行 翻译 计算 时 , 需 
要 设立 两 个 工作 栈 : 一 个 称 为 算 符 栈 (OPTR), 用 以 存储 算 符 (包括 
“##”); 另 一 个 称 为 操作 数 栈 (OPND) ,用 于 存储 操作 数 和 中 间 结 果 。 
算 符 优先 算法 的 框图 描述 如 图 4-12 所 示 。 


初始 化 : 

INIStack (OPTR); 
INIStack (OPND) 
push(OPTR,’ #!) 


读 入 一 个 字符 :read(w) 


a 
( 结束 )-==<<(w#' #')AND GET TOP(OPTR) 天 ' #' > 
人 否 
PUSH(OPND, W) 
是 


比较 GET TOP(OPTR) 与 W 的 优先 关系 
-了 一 


| OP= POP(OPTR) 
read (w) read (w) b=POP(OPND) 

a= POP(OPND) 
计算 a OP b 并 把 结果 
压 入 QPND 栈 


图 4-12 算 符 优先 算法 的 框图 
例如 : 用 上 述 算法 对 算术 表达 式 6* (3 十 2) 的 计算 过 程 如 下 所 
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算 符 栈 (OPTR) 


1. 试用 栈 编写 一 个 判别 表达 式 中 开 、 闭 圆 括 号 是 否 配 对 出 现 的 


算法 。 


2. 设 以 带头 结 点 的 循环 链表 存储 队列 ， 并 只 设 一 个 指针 指 问 


操作 数 栈 (OPND) 


习 


输入 申 
6 x (3 十 2) 闪 
x《3 十 2) 
《3 十 2) 并 
3 十 2)# 
十 27) 并 
2) 并 


队 尾 元 素 结 点 ， 试 编写 相应 的 人 队 和 出 队 算法 。 


3. 利用 两 个 栈 s 和 ss 来 模拟 一 个 队列 ， 试 编写 利用 栈 的 操作 


实现 和 人 队 和 出 队 算 法 。 
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第 五 日 串 


前 面 我 们 在 讨论 线性 表 的 操作 时 ,都 是 对 一 个 元 素 进 行 的 ,但 在 
实际 应 用 中 ,我们 有 时 需要 对 一 串 元 素 进 行 操作 。 例 如 ,在 一 个 文字 
处 理 系 统 中 ,我 们 往往 需要 插 人 和 人、 删除 、 移 动 .替换 一 段 文 字 , 这 就 需 
要 讨论 一 串 字 符 的 存储 和 处 理 的 问题 。 


5.1 串 的 定义 及 其 操作 


一 、 串 的 基本 概念 


串 又 称 字符 串 , 是 由 零 个 或 多 个 字符 组 成 的 有 限 序列 ,一 般 记 

为 : 
SS 一 alyaz…yan” (nn 之 0) 

其 中 ,S 为 串 的 名 ;* 用 成 对 单 引号 括 起 来 的 字符 序列 是 串 的 值 ,而 成 
对 的 单 引 号 本 身 仅 是 作为 串 值 的 标记 ,不 包含 在 串 值 中 .ai(1 坟 i 和 n) 
通 向 是 程序 设计 语言 中 允许 使 用 的 字符 (包括 字母 ,数字 以 及 其 它 字 
符 ), 串 中 字符 的 数 且 n 称 为 串 的 长 度 ,长 度 为 0 的 串 称 为 空 串 。 可 以 
把 串 看 作 是 以 字符 为 数据 元 素 的 线性 表 。 

串 中 任意 多 个 连续 的 字符 组 成 的 子 序列 称 为 该 串 的 子 串 ,包含 
子 串 的 串 相应 地 称 为 主 串 。 通 常 称 字符 在 序列 中 的 序号 为 该 字符 在 
串 中 的 位 置 ; 子 串 在 主 串 中 的 位 置 则 以 子 串 的 第 一 个 字符 在 主 串 中 
的 位 置 来 表示 。 

例如 ,假设 s,t,u,v 为 如 下 的 四 个 串 ， 

SS 一 ‘Shang’ ;t= ‘hai’ ;u= ‘Shanghai’ ;v= “Shang hai， 
BE 


则 它们 的 长 度 分 别 为 5,3,8,9; 并 且 s 为 u 和 v 的 子 串 ,其 在 uv 中 
的 位 置 均 为 1;t 也 是 u,v 的 子 串 ,其 在 &4 中 的 位 置 为 6, 在 v 中 的 位 


置 为 7。 


当 两 个 串 长 度 相 等 且 对 应 字符 都 相等 时 , 称 这 两 个 串 是 相等 


的 。 在 实际 应 用 中 ,我 们 还 会 遇 到 一 种 串 称 之 为 空白 串 , 它 是 由 一 个 
或 多 个 空格 (空白 符 ) 组 成 的 串 。 要 注意 空 串 和 空白 串 的 区 别 , 空 串 不 
含 任何 字符 而 空白 串 含 有 空白 符 。 


二 、 串 的 基本 操作 


对 串 的 操作 有 不 同 于 其 它 线性 结构 的 特点 , 它 往 往 是 对 一 组 连 
续 的 字符 进行 。 下 面 介绍 一 些 有 关 串 的 常用 的 基本 操作 ,其 中 s\t 为 


串 名 。 
必 
2 


赋值 操作 (assign(s,t)) :将 t 串 的 值 赋 给 s 串 。 
判 相 等 函数 (equal(s,t)): 若 s 串 和 t 串 相等 , 则 返回 函数 值 
TRUE; 否则 返回 函数 值 FALSE。 


， 连接 函数 (concat(s,t)) :结果 是 把 t 串 接 在 s 串 的 后 面 构成 


一 个 新 串 。 例 如 :s 王 “Shang ”,t 一 "hai 则 concat syt) 一 
‘Shang hal” 


. 求 长 度 (length(Cs)) :其 函数 值 为 s 串 中 字符 的 个 数 。 
， 求 子 串 substr((s,start ,len) ) : 若 1 委 start 委 length(s) 十 1 且 0 


<len 委 length(s) 一 start 十 1, 则 返回 函数 值 为 s 串 中 从 第 
start 个 字符 起 长 度 为 len 的 字符 串 序列 ;否则 返回 一 个 特殊 
的 串 常量 以 表示 所 求 子 串 不 存在 。 


.定位 函数 (index(s,t)): 若 在 主 串 s 中 存在 和 + 串 相 等 的 子 


串 ， 则 返回 函数 值 为 在 s 串 中 第 一 个 这 样 的 子 串 在 主 串 s 中 
的 位 置 ;否则 函数 值 为 零 . 注 意 : 在 定位 函数 中 串 不 能 为 空 
串 。 


， 轩 换 函 数 (replace(sst,v)) ;对 字符 串 s 中 出 现 的 所 有 子 串 4， 


用 字符 串 v 进行 替换 ,其 中 t 串 不 能 为 空 串 。 
例如 s 二 ‘ABCMDABC’ .t= ABC .v 一 "了 , 则 replace(s,t， 
v) = “HMDH? 
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8. 插入 操作 (insert(s,i,t)): 在 字符 串 s 中 位 置 ! 处 插 人 字符 串 
t, 要 求 1 二 i 全 length(s) 十 1。 
例如 ,s 二 “ABCDEF?’、t 王 xy’, 则 insert(s,3,t) = 二 “ABxy- 
CDEF” 

9. 删除 操作 (delete(Cs,i,len)) :在 字符 串 s 中 删除 从 位 置 1 起 长 
度 为 len 的 子 串 ,要求 1 科 I 委 length(s) 且 0 委 jen 委 length(s) 
二 
例如 ss 二 “ABCDEF? , 则 delete(s,3,3) 二 “ABP? 


5.2 串 的 存储 结构 


把 字符 申 作 为 一 种 操作 对 象 , 它 和 其 他 的 操作 对 象 如 整 型 量 、 实 
型 量 一 样 ,在 程序 运行 过 程 中 , 它 的 值 是 可 以 变化 的 ,并 且 对 它 也 要 
赋 于 一 个 名 字 ,通过 字符 串 的 名 字 存 取 它 的 值 。 但 是 整 型 量 、 实 型 量 
在 一 种 机 器 中 都 有 固定 的 字 长 ,而 字符 串 由 于 串 的 长 度 不 等 ,所 需 的 
存储 空间 也 就 不 一 样 ,存储 结构 当然 要 复杂 一 些 。 在 这 里 我 们 对 串 的 
存储 结构 作 简 单 的 讨论 。 


一 、 串 的 顺序 存储 结构 


一 个 字符 串 由 一 字符 序列 组 成 ,而 每 个 字符 所 需 的 存储 空间 是 
一 定 的 ,所 以 我 们 可 以 用 一 个 字符 数组 来 存放 一 个 字符 串 。 这 样 可 以 
通过 串 名 (也 就 是 数组 名 ) 直 接 访问 到 串 值 。 在 操作 时 一 个 字符 数组 
作为 一 个 整体 参加 , 它 代 表 了 一 个 字符 串 。 下 面 用 PASCAL 语言 中 
的 一 维 数组 类 型 定义 字符 串 : 
CONST maxlen 王 (允许 字符 串 的 最 大 长 度 } 
TYPE strtp 一 了 RECORD 
ch ;ARRAYT1. .maxlen | OF char; curlen :0. . maxlen 
END; 
其 中 ,ch 为 存储 串 值 的 一 维 数组 , 它 的 每 个 分 量 存放 一 个 字符 ; 
curlen 指示 串 的 当前 长 度 。 显然 ,在 这 种 存储 结构 下 字符 串 的 长 度 不 
。67 。 


能 超过 maxlen 。 
二 、 串 的 链 式 存储 结构 


对 于 字符 串 ,也 可 以 采用 类 似 于 线性 表 的 链 式 存储 结构 .例如 对 
于 字符 串 “This is a string’ 可 以 用 如 图 5-1 所 示 的 存储 结构 。 在 用 链 
表 存 放 字 符 串 时 ,一 个 结 点 中 可 以 存放 一 个 字符 ,如 图 5-1(a) 所 示 ; 
也 可 以 考虑 存放 多 个 字符 ， 如 图 5-2(b) 所 示 一 个 结 点 存放 4 个 子 
符 . 当 结 点 中 存放 的 字符 数目 大 于 1 时 ,由 于 串 长 不 一 定 正 好 是 绪 扩 
大 小 的 整数 倍 , 因 此 链表 中 的 最 后 一 个 结 点 不 一 定 会 被 串 值 占 满 ,此 
时 通常 用 一 个 不 属于 串 的 字符 集 的 特殊 字符 (如 井 号 “#”) 补 上 。 


Head 


EE Es ad 
(a) 结 点 大 小 为 1 的 链表 
Head 


(b) 结 点 大 小 为 4 的 链表 


5-1] 串 的 链 式 存储 结构 
为 了 便于 操作 , 当 用 链表 存储 串 值 时 , 除 设置 指示 第 一 个 结 扩 的 
首 指 针 外 还 可 以 附设 一 个 尾 指 针 , 指 向 链表 中 最 后 一 个 结 点 ,并 记录 
当前 串 的 长 度 。 下 面 我 们 用 PASCAL 语言 定义 字符 串 的 链 式 存 储 结 
构 。 
CONST chunksize== { 一 个 结 点 中 存放 的 字符 数 } ; 
TYPE pointer= ¢ charnode; 
charnode=RECORD 
ch:ARRAYT]. .chunksize | OF char; 
next :pointer; 
END; 
linkstrtp = RECORD 
head ,tail ; pointer ; 
length :integer ; 
| END; 
bd 


”在 链 式 存储 结构 中 , 结 点 大 小 的 选择 是 很 重要 的 , 它 直 接 影响 着 
串 的 处 理 效 率 。 在 这 里 我 们 定义 串 的 存储 密度 为 ; 
存储 密度 一 串 值 所 占 的 存储 单元 /实际 分 配 的 存储 单元 
显然 存储 密度 越 小 (如 结 点 大 小 为 1) 处 理 越 方便 ,然而 存储 占用 量 
越 大 。 特 别 是 如 果 在 串 的 处 理 过 程 中 需要 经 常 进行 内 存 和 外 存 交 换 
数据 的 话 , 则 会 因为 存储 密度 小 ,而 使 内 存 和 外 存 交换 操作 过 多 , 影 
响 处 理 的 总 效率 。 


三 、 堆 结构 


从 上 述 两 种 存储 结构 的 讨论 可 知 , 无 论 是 采用 顺序 存储 结构 还 
是 链 式 存 储 结构 ,它们 都 存在 一 些 弊病 。. 当 用 顺序 存储 结构 存储 串 值 
时 ,由 于 在 串 的 类 型 定义 中 必须 预先 规定 串 值 允 许 的 最 大 长 度 ,而 在 
一 般 情 况 下 , 串 的 长 度 变 化 范围 较 大 ,所 以 当 多 数 串 的 长 度 较 短 时 空 
间 的 利用 率 很 低 ; 而 另外 则 由 于 限定 了 串 的 最 大 长 度 , 使 串 的 某 些 操 
作 如 :连接 .置换 等 受到 长 度 的 限制 。 当 用 链 式 存储 结构 时 ,虽然 链表 
的 结构 比较 灵活 ,使 串 的 长 度 不 受 限 制 ,但 却 受 到 存储 密度 的 制约 ， 
如 果 提 高 了 存储 密度 ,必然 使 串 的 操作 复杂 化 。 

为 此 ,在 很 多 实际 应 用 的 串 处 理 系 统 中 ,对 串 采 用 一 种 动态 的 存 


” 储 结构 称 为 堆 结构 。 它 就 是 在 系统 中 开辟 一 个 容量 很 大 .地 址 连续 的 


存储 空间 作为 存放 串 值 的 可 利用 空间 。 当 建立 一 个 新 串 时 ,系统 就 从 “ 
可 利用 空间 中 分 配 一 个 大 小 和 串 的 长 度 相同 的 .地 址 连续 的 存储 空 
间 用 于 存储 新 串 的 值 。 这 样 所 有 串 的 串 值 都 存储 在 这 个 可 利用 空间 
中 。 同 时 为 每 个 串 建 立 一 个 索引 ,以 记录 该 串 的 长 度 以 及 其 串 值 在 可 
利用 空间 中 的 起 始 位 置 。 

假设 以 一 维 数组 表示 存储 串 值 的 可 利用 空间 : 

store : ARRAY [1.. maxsize] OF char; 

其 中 ,maxsize 表示 可 利用 空间 的 最 大 容量 ;并 设 一 个 指针 free( 一 个 
整 型 变量 , 初 值 为 1)， 用 于 指示 可 利用 空间 中 尚未 进行 分 配 的 空间 
的 起 始 地 址 。 

串 索 引 的 PASCAL 描述 如 下 : 
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TYPE stringtype = RECORD 
length ,stadr :integer 
END:; 
其 中 length 域 存放 串 的 长 度 ,stadr 域 指示 串 值 序列 在 store 中 的 起 
始 位 量 。 借 助 于 这 两 个 域 可 在 中 名 和 串 值 之 间 建 立 起 一 个 对 应 关系 ， 
称 做 捉 名 的 存储 映 象 。 例 如 ,图 5-2 所 示 为 四 个 串 a\b.c,d 的 存储 映 
象 以 及 可 利用 空间 的 状态 .其 中 ,a 串 的 值 为 "BEI ,长 度 为 3, 起 始 地 
址 为 1;b 串 的 值 为 “JING” ,长 度 为 5, 起 始 地 址 为 4;c 为 空 串 ;d 串 
的 值 为 ‘ SHANGHAD ,长 度 为 8, 起 始 地 址 为 9; 可 利用 空间 中 尚未 
被 分 配 的 区 间 的 起 始 地 址 为 17(free 王 17)。 
a[3[1| [BETIT [IIJNGISIHAN 
国生 上 二 
,中 叶 加 病 夯 古国 而 而 男 则 帮 响 国 畏 
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图 5-2 申 的 存储 映 象 示例 


free=17 


5.3 串 基 本 操作 的 实现 


在 这 一 节 中 ,我 们 将 讨论 串 的 基本 操作 的 实现 ;在 不 同 的 存储 结 
构 上 ,其 实现 的 算法 是 不 同 的 。 在 这 里 我 将 讨论 在 顺序 存储 结构 上 串 
操作 的 实现 , 串 的 类 型 定义 为 上 一 节 中 的 strtp。 


一 、 赋 值 运算 assign(s ,t) 


该 操作 就 是 要 将 t 串 的 值 赋 给 s 串 。 其 算法 的 PASCAL 语言 描 
述 如 下 : 
PROCEDURE assign(VAR s:strtpjt:strtp)3 
VAR i:integer; 
BEGIN 
FOR i:=1 TO t.curlen DO 
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s.ch[i]:;=t. ch[ij; 
s. curlen: =t. curlen 
END; 


二 、 判 相等 函数 equal(s,t) 


在 这 里 我 们 可 以 先 判别 串 s 和 ft 的 长 度 是 否 一 样 , 如 果 一 样 长 ， 
再 判 串 值 是 否 一 样 。 算 法 的 PASCAL 语言 描述 如 下 : 
FUNCTION equal(s,t:strtp) :boolean; 
VAR b.:bolean; 
i:integer; 
BEGIN 
IF s. curlen=t. curlen THEN 
BEGIN 
b:=TRUE;i;=1; 
WHILE (<=s.curlen) AND b DO 
BEGIN 
IF s.ch[i]<>t. ch[i] 
THEN b.:=rFALSE; 
i: 二 1 十 1 
END; 
return(b) 
END 
ELSE 
return (FALSE) 
END; 


三 、 串 的 连接 concat(s,t) 


两 个 串 的 连接 就 是 将 串 t 紧 接 在 另 一 个 串 s 的 后 面 ,组 合成 一 
个 新 串 。 由 于 串 值 采用 顺序 存储 结构 存放 ,所 以 连接 后 的 串 长 可 能 会 
超过 串 长 允许 的 长 度 , 这 就 要 给 出 一 个 "溢出 "信息 ,图 5-3 为 串 连接 
算法 的 框图 描述 。 
该 算法 的 PASCAL 语言 描述 如 下 : 
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FUNCTION concat(VAR s:strpt; t:strpt) :boolean; 
VAR p,i:integer:; 
BEGIN 
IFE《〈s. curlen 十 t. curlen)>maxlen 
THEN return (FALSE) 
ELSE 
BEGIN 
z p :一 s. curlen; 
FOR i:;=1 TO t.curlen DO 
s. chfp+i]:=t. ch[ij; 
s, curlen:—s. curlent+t. curlen; 


return (TRUE) 


END 


END; 


根据 t 串 的 长 度 组 织 循环 
将 t 串 中 的 字符 逐个 接 到 
S 串 后 面 


修改 S 串 的 长 度 


结束 


返回 “溢出 ?信息 


图 5-3 串 的 连接 算法 框图 
、 求 子 串 substr(s ,start ,len) 


求 子 串 的 过 程 也 是 复制 字符 序列 的 过 程 , 但 当 所 求 子 串 在 s 串 
中 的 起 始 位 置 或 子 串 长 度 不 合理 时 ,应 给 出 “出 错 " 信 息 。 该 算法 的 
PASCAL 语言 描述 如 下 : 
FUNCTION stubstr(VAR sub :srtp; s:strtp; 


start ,len :integer) :boolean ; 
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VAR p,i:integer; 
BEGIN 
IF (1<~=start) AND (start<=s.curlen+1) AND 
(0<=len) AND (en<=s.curlen—start 二 1) 
THEN BEGIN 
p:=start—1; 
FOR i:=1 TO len DO 
sub. ch[i|];=s.chLp++i); 
sub. curlen : =len; 
return(TRUE) 
END 
ELSE BEGIN 
sub. curlen;=—1; 
return (FALSE) 
END:; 
END; 
下 面 我 们 举例 说 明 此 函数 的 调用 情况 。 
例如 :s= "This is a string.” 则 
1. b: 二 substr(t,s,11,6); 得 到 子 串 t= ‘string’.b 为 TRUE。 
2. b: =-substr(t',s 11,8); 得 到 子 串 t 的 值 不 确定 ,b 为 FALSE， 


五 、 定 位 函数 index(s,t) 


子 串 的 定位 操作 就 是 求 子 串 在 主 串 中 的 位 置 , 通 常 称 为 串 的 模 
式 匹 配 ( 其 中 子 串 t 称 为 模式 )。 这 个 操作 是 各 种 串 处 理 系统 中 最 重 
要 的 操作 之 一 。 其 算法 的 基本 思想 是 : 从 主 串 s 的 第 一 个 字符 起 和 
模式 t 的 第 -个 字符 进行 比较 ,如 果 相 等 则 继续 逐个 比较 后 续 字符 ; 
否则 从 主 串 的 第 二 个 字符 起 再 重新 和 模式 的 第 一 个 字符 进行 比较 。 
依次 类 推 ,直至 模式 t 中 的 每 个 字符 依次 和 主 串 s 中 从 第 i 个 字符 开 
始 的 一 个 子 串 相等 , 则 称 模式 匹配 成 功 ， 郴 数 返 回 模式 t 的 第 一 个 
字符 在 主 串 s 中 的 序号 ;否则 称 匹 配 不 成 功 ,函数 返回 零 。 如 下 展示 
了 模式 t= 二 “abcac’” 和 主 串 s 二 ‘ababcabcacbab?’ 的 匹配 过 程 。 
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+ 
y 1 一 


ababcabcacbab 第 一 趟 匹配 
abc 
人 一 3 
V2 
ababcabcacbab . 第 二 趟 匹配 
a 
hj=1 
YE 
ababcabcacbab 第 三 趟 匹配 
abcac 
Nj=5 
yi=:4 
ababcabcacbab 第 四 趋 匹 配 
a 
| 
yi 一 5 
ababcabcacbab 第 五 趟 匹配 
a 
hi=1 
yi 一 11 
ababcabcacbab 第 六 趟 匹配 
abcac 
‘j=6 


结果 ,函数 返回 模式 t 在 主 串 s 中 的 序号 6(it, curlen)。 


Pascal 语言 描述 如 下 。 
FUNCTION index(s,t:strtp) ;integer’; 
VAR 1,j:integer; 
BEGIN 
l= ly j= 13 
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该 算法 的 


WHILE (< =s.curlen) AND (<=t.curlen) DO 
IF s.ch[lil=t. ch[i] 


THEN BEGIN i:=i+1; 1: 王 ] 十 1 END 
ELSE BEGIN i; 一 1i 一 ) 十 2; J:=1 END; 
IF j>t. curlen 


THEN return (i—t. curlen) 
ELSE return (0) 
END; 


5.4 文本 编辑 


文本 编辑 是 字符 串 处 理 中 最 常见 的 应 用 之 一 。 文 本 编辑 的 含义 
是 :删除 或 替换 文本 中 指定 的 一 些 行 或 行 中 的 某 些 字符 ; 插入 一 些 
新 的 行 或 字符 。 计 算 机 高 级 语言 ( 如 PASCAL 语言 ) 源 程序 的 修改 
以 及 报纸 .书籍 、 期刊 ,文章 的 修改 ,都 可 以 在 计算 机 上 通过 文本 编辑 
程序 用 一 系列 编辑 命令 完成 。 例 如 :一 份 用 PASCAL 语言 编写 的 源 
程序 ,可 以 看 成 是 一 个 文本 。 它 不 是 简单 的 由 一 个 长 字符 串 组 成 ,一 
般 要 分 成 许多 页 ,每 页 由 若干 行 组 成 。 表 示 这 种 行 页 结构 的 方法 ,在 
不 同 的 计算 机 系统 中 是 不 同 的 ,常用 的 方法 是 以 特定 的 控制 字符 来 
实现 。 如 用 ASCII 字符 集中 的 回 车 符 CR (用 符号 ”< ”表示 ) 和 换行 
符 ( 用 符号 “y ”表示 ) 表 示 一 行 结束 ;用 换 页 符 FF( 用 符号 “至 ? 表 
示 ) 表 示 一 页 结束 。 当 用 户 调用 文本 编辑 程序 时 ,在 将 文本 输入 到 内 
存 的 同时 ,由 编辑 程序 建立 一 个 行 表 , 行 表 中 的 每 一 项 表示 一 行 , 它 
由 行 号 .存储 该 行 字符 串 的 起 始 地 址 以 及 该 行 字 符 串 的 长 度 等 组 成 。 
在 文本 编辑 过 程 中 ,编辑 程序 对 文本 的 访问 是 以 行 表 的 内 容 为 依据 
的 。 所 以 对 文本 的 修改 就 直接 反映 在 行 表 上 。 例 如 有 下 面 一 段 程序 
需 输入 到 内 存 , 其 中 符号 “@” 表 示 空 格 符 。 

PROCEDURE®EX;<— J 

DVAR®Di,j:integer;<— 

PBREGIN<-y 

PPBread(i) ;< 
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. BDj; =itixi;e 
DEND;<— + 
由 于 输入 时 发 生 了 差错 ,实际 输入 到 内 存 中 的 的 文本 如 图 5-4 
所 示 。 假 定 存储 地 址 从 201 开始 , 则 编辑 程序 建立 的 相应 行 表 如 图 
5-5(a) 所 示 。 


图 5-4 错误 文本 的 存储 状态 

对 这 个 有 错 的 文本 ,其 修改 步骤 如 下 ; 

1. 删除 第 110 行 。 这 只 要 在 行 表 中 删除 110 行 ， 此 时 由 于 不 能 
访问 到 地 址 为 216 至 223 的 存储 空间 ,就 等 于 删除 了 第 110 行 。 

2. 插入 新 的 一 行 , 其 内 容 为 “@VARGi,j:integer;<-y ”。 这 时 ， 
可 根据 新 行 的 长 度 ,将 其 存放 在 可 利用 空间 的 空闲 区 , 即 可 从 地 址 
264 开始 存储 此 行 , 而 其 行 号 仍 为 110。 这 样 修改 后 ,新 的 正确 的 行 表 
内 容 如 图 5-5(b) 所 示 。 经 编辑 修改 后 的 正确 文本 在 可 利用 空间 中 的 
状态 如 图 5-6 所 示 。 


(b) 正 确 文本 的 行 表 
行 表 示例 


。76 。 


257 204 


oe | a | | 
到 


图 5-6 正确 文本 的 存储 状态 
在 上 例 中 ,插入 的 新 行 ,实际 存储 在 原文 本 的 后 面 。 所 以 , 它 没有 
移动 数据 。 当 然 , 也 可 以 通过 移动 数据 ,把 新 行 插 在 第 100 行 的 后 面 。 
这 些 具体 的 算法 ,读者 可 利用 串 的 基本 运算 自己 完成 。 


习 题 


1. 设 S='TAMASTUDENT',，T='GOOD ， Q ='WORK- 
ER'。 求 : 
length (S), length(T), substr(S,8,7), substr(T ,2,1), in- 
dex(S，'A') ，replace(S, ,STUDENT' ,Q) ，concat (substr 
(S,6,2),concat(T ,substr(S,7,8))), 

2. 设 S= (ABC) 十 *', T=='(A 十 C) x C' 。 试 利用 联接 、. 求 子 串 
和 置换 等 基本 运算 ,将 S 变 为 工 。 

3. 给 定 两 个 串 a 和 b, 求 在 a 串 中 第 一 次 出 现 ， 而 在 b 串 中 不 出 
现 的 字符 的 序号 。 试 编写 此 算法 。 


ea 7 了 7。 


第 六 日 数 组 


数组 是 大 家 所 熟悉 的 一 种 数据 类 型 ,几乎 所 有 的 程序 设计 语言 
都 设 定 数组 类 型 为 图 有 类 型 。 所 以 在 本 日 中 仅 简 单 地 讨论 数组 的 逻 
辑 结构 定义 及 其 存储 结构 。 


6.1 数组 的 定义 和 运算 


数组 可 以 看 成 是 线性 表 的 推广 ,数组 中 每 个 元 素 是 由 一 个 值 和 

一 组 下 标 组 成 的 。 如 图 6-1 所 示 ,就 是 一 个 二 维 数组 , 记 作 AL1. .m， 
1. .nj。 二 维 数 组 也 称 为 矩阵 。 

all 412* ain 在 这 个 二 维 数 组 中 ,每 个 元 素 ai (在 

1 a22 ” PASCAL 语言 中 记 为 afi,j]) 都 同时 属于 

两 个 线性 表 , 一 个 是 第 1 行 的 行 表 (ailyaiz， 

…,ain) ; 男 一 个 是 第 j 列 的 列表 (aiyasi,…， 

图 6-1 二 维 数组 示例 ”。)。 这 种 行 表 和 列表 都 相当 于 一 维 数组 。. 

我 们 可 以 把 二 维 数组 看 成 是 这 样 的 一 个 线性 表 , 它 的 每 个 数据 元 素 

是 一 个 线性 表 。 例 如 图 6-1 所 示 的 二 维 数组 , 它 可 以 看 成 是 一 个 线 

性 表 : 


Am] am2""* dm 


A= (ai ,a ,Qn ) 
其 中 每 一 个 元 a(1 志 jn) 是 一 个 列 向 量 的 线性 表 : 
oj 一 《aliya2i… yami) 
当然 ,我 们 也 可 以 把 这 个 二 维 数组 看 成 是 如 下 一 个 线性 表 : 
A= (B,B,… ,B,) 
其 中 每 一 个 元 B(1 志 im) 是 一 个 行 向 量 的 线性 表 : 
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B= (ai yaiz…ain) 

同样 ,三 维 数组 可 以 看 成 数据 元 素 为 二 维 数 组 的 线性 表 。 依 次 类 推 ， 
n 维 数组 可 以 看 成 数据 元 素 为 n 一 1 维 数组 的 线性 表 。 因 此 ,数组 是 
线性 表 的 一 种 推广 。 在 这 里 值得 大 家 注意 的 一 点 就 是 一 个 数组 中 所 
有 的 数据 元 素 都 必须 属于 同一 数据 类 型 。 对 于 数组 通常 只 有 两 种 基 
本 操作 

1. 给 定 - -组 下 标 , 存 取 相 应 的 数据 元 素 。 

2. 给 定 -- 组 下 标 , 修 改 相应 数据 元 素 中 的 数据 项 。 


6.2 数组 的 顺序 存储 结构 


数组 的 顺序 存储 结构 就 是 用 一 组 连续 的 存储 单元 顺序 存放 数组 
元 素 。 由 于 存储 单元 是 一 维 结构 ,而 数组 是 一 个 多 维 结构 ,所 以 用 一 
组 连续 的 存储 单元 存放 数组 元 素 时 就 要 考虑 存放 的 次 序 问题 。 

首先 我 们 讨论 二 维 数组 ,元素 间 的 次 序 可 以 有 两 种 排序 方法 ,一 
种 方法 就 是 按 行 的 次 序 进行 排列 , 称 为 “ 行 优先 序 ”, 它 就 是 把 数组 元 
素 按 行 表 次 序 ,第 i 十 1 行 的 元 素 紧 跟 在 第 i 行 元素 后 面 进行 存储 ,如 
图 6-2(b) 所 示 ; 另 一 种 方法 就 是 按 列 的 次 序 进行 排列 , 称 为 “ 列 优 
先 序 ”, 它 就 是 把 数组 元 素 按 列表 次 序 、 第 j 十 1 列 元 素 紧 跟 在 第 j 列 
元 素 后 面 进行 存储 ,如 图 6-2(c) 所 示 。 


alt 812 
3a21 a22 
a31 a32 


a41 342 


(a) 二 维 数组 〈b) 行 优选 顺序 (ec) 列 优选 顺序 
的 逻辑 状态 存储 存储 


图 6-2 二 维 数组 的 顺序 存储 结构 
同样 ,对 于 n 维 数组 也 有 上 述 两 种 不 同 的 顺序 存储 方法 :“ 右 下 
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标 优先 序 ”" 和 “左下 标 优先 序 ”, 它 们 分 别 相 当 于 二 维 数组 的 “ 行 优先 
序 ” 和 “ 列 优 先 序 ”把 n 维 数 组 的 元 素 按 上 述 方式 顺序 存放 在 存储 单 
元 中 , 则 每 个 元 素 的 存储 地 址 可 以 用 一 条 公式 计算 出 来 ,这 条 公式 称 
为 “地 址 公式 ”。 假 设 每 个 数据 元 素 只 占 一 个 存储 单元 并 以 “ 右 下 标 
优先 序 ? 进 行 顺 序 存 储 , 则 "地址 公式 ?为 : 
对 于 一 维 数组 ALl..mj, 其 中 任 一 元 素 ai(1 委 i 魏 m) 的 存储 地 
址 为 : 
LOC(a)=LOC(al)+ (1—1) 
其 中 ,LOC(ai) 表 示 元 素 ai 的 存储 地 址 ;LOC (a ) 为 元 素 ai 的 存储 地 
址 , 即 一 维 数组 A 的 起 始 存 储 位 置 ,又 称 基 地 址 。 
对 于 二 维 数 组 ALl..m,1..nj, 其 中 任 一 元 素 ai 的 存储 地 址 为 : 
LOC(ai)=LOC(an) tn (1 一 ]) 十 (一 二 ) 
其 中 ;LOC(a;) 表 示 元 素 ai 的 存储 地 址 ;LOC(all) 为 元 素 au 的 存储 地 
址 , 它 是 二 维 数组 A 的 基地 址 。 图 6-3 是 这 个 地 址 公式 的 示意 图 。 


Loc (all) Loc (ai ) 


| n 炎 (1 一 1) 个 元 率 


(j 一 1) 个 元 素 


图 6-3 二 维 数组 A[1..m,1..nj 的 存储 状态 
对 于 三 维 数 组 A[l..1,1..m,1..nj, 可 以 分 解 为 1 个 mxn 的 二 
维 数组 , 则 其 中 任 一 元 素 aik 的 存储 地 址 为 : 
LOC(aix)=LOC(an)+mxnx (i—1)++nx (J—1)+(k—1) 
其 中 ,LOC(aiu) 为 三 维 数组 A 的 基地 址 ,图 6-4 为 三 维 数组 的 地 址 
公式 示意 图 。 
从 上 述 地 址 公式 ,可 以 很 容易 地 推广 到 mn 维 数组 , 设 有 nn 维 数组 A 
[1. .di,1..d;,…,1..d,j, 则 其 中 任 一 元 素 ailiz.in 的 存储 地 址 为 : 
LOC(aiin) 一 LOC(ail) 十 dxdsx… 关 dx(n 一 |) 
十 dx dy * «x ds x (ip 一 1) 
于 di) 
。 SO。， 


即 ， 


LOC (ailiz.in ) LOC 《8 ) 十 2 S; x (1; Se 1 ) 


其 中 ,S,= [| a， bes ei 


ce m 火 n(i 一 1) 个 元 素 aijk 

[人 
2 第 1 页 ”第 2 页 第 i 一 1 页 第 i 页 
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图 6-4 三 维 数组 A[1..1,1..m,1..n] 的 存储 状态 

从 中 可 以 看 出 ,在 顺序 存储 结构 中 ,数组 元 素 的 存储 位 置 是 其 下 
标的 一 个 线性 函数 ,所 以 存 取 数组 中 任 一 元 素 的 时 间 是 相等 的 ,我 们 
称 具 有 这 一 特点 的 存储 结构 为 随机 存储 结构 。 

在 上 述 公 式 中 ,n 维 数 组 中 每 一 维 的 下 界 都 定 为 1, 并 且 每 个 元 
素 只 占 一 个 存储 单元 ;如 果 下 界 不 为 1, 每 个 元 素 占 c 个 存储 单元 ， 
则 应 如 何 修 改 数组 的 地 址 公式 ? 还 有 如 果 数 组 元 素 以 “左下 标 优先 
序 ” 顺 序 存储 , 则 地 址 公式 又 是 如 何 ? 请 读者 根据 上 述 讨 论 自己 思考 。 


6.3 敌阵 的 压缩 存储 


在 很 多 科学 和 工程 计算 中 ,和 抢 阵 是 研究 的 主要 数学 对 象 之 一 。 在 
这 里 ,我 们 不 是 讨论 矩阵 的 本 身 , 而 是 要 讨论 如 何 存储 矩阵 中 的 元 
素 , 从 而 使 矩阵 的 各 种 运算 能 有 效 地 进行 。 

一 般 情况 下 ,用 高 级 语言 编制 程序 时 ,都 是 用 二 维 数组 的 顺序 存 
储 结构 存放 和 矩阵 元 素 .然而 ,在 数值 分 析 中 经 常 出 现 一 些 阶 数 很 高 的 
矩阵 ,并 且 在 矩阵 中 有 许多 值 相同 的 元 素 或 者 值 为 零 的 元 素 ( 零 元 
素 )。 有 时 为 了 节省 存储 空间 ,需要 对 这 些 和 矩阵 进行 压缩 存储 。 所 谓 
压缩 存储 是 指 :为 多 个 值 相 同 的 元 素 只 分 配 一 个 存储 空间 ;对 零 元 素 
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”不 分 配 空间 。 如 果 这 些 值 相同 的 元 素 或 零 元 素 在 矩阵 中 的 分 布 有 一 
定 规律 , 则 我 们 称 这 类 和 矩阵 为 特殊 和 矩阵 ;反之 , 称 为 稀疏 和 矩阵。 下面 分 
别 对 这 两 类 矩阵 讨论 它们 的 压缩 存储 。 


一 、 特 殊 矩 阵 


如 果 在 一 个 nxn 阶 的 矩阵 A 中 ,其 元 素 满足 下 述 性 质 : 
ai 一 ai 1] 二 二 1 二 三 n 
则 称 A 为 nx*n 阶 对 称 矩 阵 。 

对 于 对 称 和 矩阵 ,我 们 可 以 为 每 一 对 对 称 元 素 (ai,ai) 分 配 一 个 存 
储 空间 ,这 样 nz 个 元 素 就 可 以 压缩 存储 到 n(n 十 1)/2 个 存储 空间 
中 ,不 失 一 般 性 ,对 这 样 的 矩阵 以 行 优先 序 ,把 它 的 下 三 角 ( 包 括 对 角 
线 ) 元 素 , 存 放 在 一 维 数组 Sa[1.. Cn 十 1) /2] 中 , 则 一 维 数组 中 元 素 
Sa[k] 和 和 矩阵 中 元 素 ai 之 间 存 在 如 下 一 一 对 应 的 关系 : 

-| 当 1! 之 二 ] 
ji(j 一 1)/2 十 i 当 i1<=] 
由 此 可 见 , 对 于 任意 给 定 的 一 组 下 标 (i,j), 均 可 在 Sa 中 找到 矩阵 元 
ai; 反 之 ,对 所 有 的 k= 二 1,2,… ,n(n 十 1)/2 都 能 确定 Sa[Lkj 中 的 元 素 
在 矩阵 中 的 位 置 (i,j)。 这 种 一 维 数组 Sa 称 为 n xn 阶 对 称 和 矩阵 A 的 
压缩 存储 ,图 6-5 为 对 称 和 矩阵 压缩 存储 的 示意 图 。 


… nn 一 1y2 十 1…nkn 一 ])A2 


图 6-5 对称 矩阵 的 压缩 存储 

对 称 矩 阵 的 这 种 压缩 存储 方法 也 适用 于 下 (上 ) 三 角 和 矩阵 。 所 谓 
下 (上 ) 三 角 和 矩阵 是 指 矩阵 的 上 (下 ) 三 角 ( 不 包括 对 角 线 ) 中 的 元 素 均 
为 常数 < 或 零 。 只 是 对 于 下 (上 ) 三 角 和 矩阵 ,除了 只 存储 其 下 (上 ) 三 
角 中 的 元 素 外 ,还 必须 再 加 一 个 存储 单元 ,用 于 存储 常数 c。 

在 这 些 特殊 矩阵 中 , 非 零 元 素 的 分 布 都 有 一 个 明显 的 规律 ,从 而 
可 以 将 其 压缩 存储 到 一 维 数组 中 。 然 而 ,在 实际 应 用 中 还 会 经 常 遇 到 
这 样 一 类 矩阵 ,其 非 零 元 素 很 少 而 且 分 布 没有 规律 ,我 们 称 之 为 稀 朴 


了 


矩阵 。 如 图 6-6(a) 所 示 ,M 为 6x* 7 的 矩阵 ,共有 42 个 元 素 , 其 中 只 
有 8 个 非 零 元 素 , 则 M 就 是 一 个 稀 朴 矩阵 。 
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(a) 稀 政和 矩阵 M (b) 稀疏 和 矩阵 和 


图 6-6 稀 朴 矩阵 图 示 
由 于 这 类 和 矩阵 中 非 零 元 素 的 分 布 没 有 规律 ,所 以 压缩 存储 就 要 
比特 殊 和 矩阵 复杂 。 下 面 我 们 讨论 用 三 元 组 和 十 字 链 表 对 稀 玖 矩阵 进 
行 压 缩 存储 。 


二 、 稀疏 和 矩阵 的 三 元 组 存储 结构 


我 们 知道 ,矩阵 中 的 每 一 个 元 素 都 对 应 有 一 组 下 标 (i,j) 和 元 素 
本 身 的 值 ; 每 当 存 储 一 个 矩阵 元 素 ,就 要 考虑 如 何 表示 这 组 下 标 和 元 
素 本 身 的 值 在 前 面 讨论 的 无 论 是 数组 的 顺序 存储 结构 ,还 是 特殊 和 矩 
阵 的 压缩 存储 都 是 通过 存储 地 址 隐 式 地 表示 了 元 素 的 下 标 ,而 元 素 
的 值 则 是 显 式 地 存放 在 存储 单元 中 .将 稀 朴 矩阵 进行 压缩 存储 ,显然 
要 把 每 个 非 零 元 素 的 下 标 和 值 都 显 式 地 表示 出 来 ;我 们 可 以 考虑 用 
一 个 三 元 组 (i,j,val) 表 示 , 其 中 i 和 j 分 别 表示 元 素 所 在 的 行 和 列 ， 
val 表示 元 素 的 值 。 例 如 ,对 图 6-6(a) 所 示 的 稀疏 矩阵 ,M 中 的 八 个 
非 零 元 素 可 以 用 如 下 八 个 三 元 组 表示 , 它们 可 按 行 优先 序 排列 ; (1， 
2,8)、(1],4,—3).(2,6,4)、(3,3,24)、(4,1,—12)、(4,5,2)、(5,7, 
15)、(6,2,6)。 这 些 三 元 组 组 成 一 个 线性 表 , 线 性 表 中 的 每 个 数据 元 
素 是 一 个 三 元 组 。 另 外 ,为 了 唯一 地 确定 稀疏 矩阵 ,在 线性 表 的 第 零 
个 位 置 上 增加 一 个 表示 矩阵 行 数 、 列 数 ,和 非 零 元 素 个 数 的 三 元 组 。 
对 这 个 线性 表 , 可 采用 顺序 存储 结构 。 例 如 ,对 于 图 6-6(a) 所 示 的 稀 
琉 和 矩阵 M, 其 三 元 组 形式 表示 的 顺序 存储 结构 如 图 6-7(a) 所 示 ，。 
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B[8] 


(a) 矩阵 M 的 三 元 组 向 量 A_ (b) 和 矩阵 N 的 三 元 组 向 量 B 


图 6-7 稀疏 矩阵 的 三 元 组 存储 结构 

其 中 ,aLO] 表 示 和 矩阵 M 共有 6 行 .7 列 . 共 8 个 非 零 元 素 ;aLlj、aL2]、 
… .a[8j] 分 别 表示 了 和 矩阵 M 中 的 8 个 非 零 元 素 。 

用 三 元 组 实现 稀 朴 抢 阵 的 压缩 存储 ,那么 如 何在 三 元 组 上 进行 
矩阵 的 运算 呢 ? 下 面 以 矩阵 的 转 置 运算 为 例 进行 讨论 。 

对 于 一 个 mxn 的 矩阵 M, 它 的 转 置 矩阵 N 是 一 个 nxm 的 和 矩 
阵 ,并 且 N[i,j] 二 MDj,i,1 二 Rn\1 声 j 寺 m。 例 如 ,图 6-6(a) 所 示 的 
矩阵 M, 其 转 置 矩阵 N 如 图 6-6(b) 所 示 。 对 于 矩阵 N, 其 三 元 组 表示 
如 图 6-7(b) 所 示 。 当 然 我 们 关心 的 是 如 何 从 向 量 a 中 求 得 向 量 b? 对 
于 向 量 a 中 的 每 一 个 分 量 来 说 ,只 要 将 其 行 域 和 列 域 的 内 容 进行 交 
换 ,就 得 到 了 向 量 b 中 的 一 个 分 量 。 向 量 a 中 的 分 量 次 序 是 以 和 矩阵 M 
的 非 零 元 素 的 “ 行 优先 序 ” 进 行 排列 的 ,对 于 矩阵 N 的 三 元 组 向 量 b， 
其 分 量 当 然 也 应 该 按 “ 行 优先 序 ” 进 行 存储 。 然 而 ,如 果 按 向 量 a 中 的 
顺序 将 每 个 分 量 进行 转换 ,显然 转换 后 得 到 的 向 量 b 不 符合“ 行 优先 
序 ”。 例 如 ,依次 把 向 量 a 中 分 量 进行 行 . 列 交换 ,得 到 : 


(6,7,8) (7,6, 8) 
Cls233) (2,1, 8) 
(lydi3) Sy A 3 
(2,6,4) (6,2, 4) 


(3,3,4) (3,3,24) 
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要 使 转 置 矩 阵 N 的 三 元 组 向 量 b 以 “ 行 优先 序 ? 排 列 ,容易 想 到 
的 一 个 方法 就 是 按 向 量 a 中 的 顺序 进行 转换 ， 并 且 每 转换 完 一 个 分 
量 就 按 其 在 向 量 b 中 的 “ 行 优先 序 ? 把 它 插 到 适当 的 位 置 。 这 样 做 虽 
然 能 满足 要 求 , 但 移动 元 素 十 分 频繁 。 为 了 避免 元 素 移动 ,可 以 采取 
以 下 二 种 方法 。 
1. 按 和 矩阵 M 中 的 列 序 进行 转 置 
这 种 方法 就 是 :首先 考虑 把 矩阵 M 的 第 1 列 非 零 元 素 转换 成 矩 
阵 N 的 第 1 行 元 素 ; 然 后 再 考虑 把 矩阵 M 的 第 2 列 非 零 元 素 转换 成 
和 矩阵 N 的 第 2 行 元 素 ;依次 类 推 , 最 后 把 矩阵 M 的 第 n 列 ( 最 后 一 
列 ) 非 零 元 素 转 换 成 矩阵 N 的 第 n 行 元 素 。 当 然 ,为 了 寻找 矩阵 M 
中 每 一 列 的 非 零 元 素 , 都 需要 对 向量 a 全 部 扫描 一 遍 , 图 6-8 为 其 算 
法 的 框图 描述 。 
根 杨 图 6-8 所 示 的 算法 框图 ,可 用 PASCAL 语言 描述 如 下 : 
CONST 
maxmum 一 {人 允许 的 非 零 元 紊 个 数 )， 
TYPE 
node= RECORD 
1,]:integer; 
val :integer; 
END; 
listar 一 ARRAYL[L0. .maxnum | OF node; 
PROCEDURE trans-sparmat (VAR b :listary a:listar); 


VAR 
col,k,p,n,t:integer; 

BEGIN 
b[0].i;:=a[0].j; 
b[0].j: =a[0].i; 


bLo]j. val: =af0]. val; 
n: =a[0].j; t:=a[0]. val; 
IF t<>0 THEN 
BEGIN 
P;:=1; 
Re 


FOR col :=1 TO n DO 
FOR k:=1 TO t DO 
IF a[lk |].j=col THEN 
BEGIN 
b[pj.i:=alk].j; 
blpj.j:=alk.i; 
blpj. vol: =alk |]. vol; 
p: 一 P 十 1 
END 
END 
END:; 

在 过 程 trans-sparmt 中 ,为 了 依次 在 向 量 b 中 存 人 三 元 组 ,定义 
了 一 个 指示 器 p, 用 于 指示 向 量 b 中 按 行 优先 序 应 存 人 的 非 零 元素 
的 当前 位 置 , 其 初 值 为 1; 当 向 量 b 中 存 和 人 一 个 非 零 元 素 后 ,就 修改 
一 下 p(p: 王 p 十 1)。 

此 转 置 算法 的 时 间 主 要 花 在 两 个 FOR 语句 上 ,所 需 的 时 间 复 杂 
度 为 O(n x t)。 当 稀 疏 矩阵 的 非 零 元 素 的 数目 t 和 mx*xn 等 数量 级 
时 ,其 时 间 复 杂 度 为 O(n2x m)。 而 在 一 般 情 况 下 ,和 矩阵 的 转 置 算法 
为， 

FOR col;=1 TO n DO 
FOR row:=1 TO m DO 
Nf[fcolrow]: 王 MLrowycolji 
其 时 间 复 杂 度 为 O(m x n), 由 此 可 见 trans-sparmt 算法 仅 适用 于 
t<<nx m 的 情况 。 

2. 按 和 矩阵 M 中 的 行 序 进行 转 置 

上 面 介绍 的 方法 是 按 和 矩阵 M 中 的 列 序 进行 转 置 的 。 当然 , 转 置 
方法 也 可 以 按 和 矩阵 M 中 的 行 序 进行 ,但 转 置 后 的 三 元 组 需 按 矩阵 N 
的 行 优 先 序 直接 填 到 向 量 b 的 适当 位 置 上 。 这样 按 和 矩阵 M 的 行 序 进 
行 转 置 , 则 只 需 对 向 量 a 扫描 一 次 ;而 按 和 矩阵 N 的 行 优先 序 直接 将 
三 元 组 填 到 向 量 b 的 适当 位 置 , 可 以 避免 向 量 b 中 元 素 的 移动 。 显 
然 ,这 种 方法 是 十 分 可 取 的 。 但 问题 是 如 何 确定 矩阵 M 中 的 一 个 非 

*。 86。 


通过 AL0j, 求 矩阵 和 的 行 数 , 列 数 
和 非 零 元 素数 目 , 赋 给 BLO] 


从 ALOj 中 到 矩阵 M 的 列 数 n 和 非 
零 元 数目 t 


矩阵 M 中 有 非 零 元 素 吗 (t:0)? 


有 (t 关 0) 


组 织 外 循环 ,从 和 矩阵 M 的 第 1 列 
《col 二 1) 开 始 进行 转换 


无 Mt 一 0) 


对 矩阵 M 的 所 有 列 都 转换 完了 吗 ? Yes(col>n) 


《col:n) 


No(k<=n) 


组 织 内 循环 从 向 量 A 的 第 1 个 分 量 
(k 一 1) 开 始 寻 找 矩 阵 M 的 第 co] 列 元 
素 进行 转换 

Yes(k>t) 


对 向 有 量 A 全 部 搜索 完了 吗 ? (k:t. 


No(k<=t) 
向 量 A 的 第 K 个 分 量 C(A[k]) 的 列 且 No 


中 否 为 col 
进行 转换 依次 在 向 量 B 中 存 人 一 个 
三 元 组 


修改 列 号 col(col 一 col 十 1) 


图 6-8 按 和 矩阵 M 的 列 序 进行 转 置 的 算法 框图 
零 元素 在 向 量 b 中 的 位 置 ? 对 于 这 个 问题 ,我 们 可 以 这 样 做 :首先 求 
出 和 矩阵 M 中 每 一 列 的 非 零 元 素 的 数目 ,存放 在 一 个 数组 numLl. .nj 
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中 Cn 是 矩阵 M 列 数 ), 这 个 数组 的 每 一 个 分 量 num[Lcol 1(1<<col<&n) 
表示 了 和 矩阵 M 的 第 col 列 中 非 零 元 素 的 数目 ;然后 ,由 于 和 矩阵 M 中 
第 1 列 的 第 一 个 非 零 元 素 转 置 后 总 是 为 矩阵 N 的 第 1 行 的 第 一 个 
非 零 元 素 , 所 以 , 它 必 然 存 放 在 bL1] 中 。 这 样 ,根据 数组 num[ 1..nj 
就 可 以 推算 出 矩阵 M 中 每 一 列 的 第 一 个 非 零 元 素 在 向 量 b 中 的 位 
置 ; 我 们 用 一 个 数组 potL1. .nj 来 记录 这 些 位 置 ,这 个 数组 的 每 个 分 
量 potLcol] 表 示 了 和 矩阵 M 中 第 col 列 的 第 一 个 非 零 元 素 在 向 量 b 中 
的 位 置 ,并 有 : 

pot[1|]:=1; 

potf col | 二 potLeol—1]+num[col—1|」 ,2<=col<=n 
例如 ,对 图 6-6(a) 所 示 的 矩阵 M, 其 num 和 pot 数组 的 值 如 下 : 


num[ col | 


pot[Lcolj 


有 了 数组 pot 就 知道 了 和 矩阵 M 中 每 一 列 的 第 一 个 非 零 元 素 在 
向 量 b 中 的 位 置 ,这 样 我 们 就 可 以 按 和 矩阵 M 的 行 序 进行 转 置 。 当 按 
行 序 把 矩阵 M 中 第 col 列 的 一 个 非 零 元 素 转 置 时 ,就 把 转 置 后 的 二 
元 组 存放 在 向 量 b 中 由 pot[col]j 所 指示 的 位 置 , 然 后 修改 pot[Lcolj 
(pot[col]: 王 pot[col] 十 1) 使 其 指向 矩阵 M 中 第 col 列 的 下 一 个 非 零 
元 素 在 向 量 b 中 的 位 置 . 这 样 ,我 们 依靠 数组 pot ,就 可 实现 矩阵 的 转 
置 。 其 算法 的 框图 如 图 6-9 所 示 。 

根 这 个 框图 ,我 们 用 如 下 的 PASCAL 语言 描述 这 个 算法 。 
CONST 
maxn 王 {和 矩阵 中 最 大 的 列 数 ); 
PROCEDURE fast-trans(VAR b.:listar; a:listar); 
VAR 
pot ,num:ARRAY[]1. .maxn | OF integer; 


col,k,n,t:integer; 


BEGIN 
b[L0].j:=aL0j.i; 
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b[0]. val: 一 aLOj. val; 
n:=a[0].j; t: 一 al0j. val; 
IF t<>>0 THEN 


BEGIN 
FOR col:=1 TO n DO 
numlcol ] :一 0; 


FOR k:=1 TOt DO 
num[a[k].j]:=num[a[kj]. jj+1; 
pot[L1] :一 1 
FOR col:=2 TO n DO 
pot[col]: =pot[col—1j+num[Leol—11]; 
FOR k:=1 TOt DO 
BEGIN 
col :一 aLk]. j; 
b[pot[col |] ].i: =alk].} 
b[pot[col |].j: =alkj].i; 
b[Lpotfcol | |]. val: =alk |. val; 
pot[col |: =potLcol | 站 
END 
END 
END; 
显然 ,这 个 算法 比 上 一 个 算法 多 用 了 两 个 辅助 向 量 (num、pot)。 从 时 
间 上 看 ,算法 中 有 四 个 并 列 的 单 循环 ,循环 次 数 分 别 为 n 和 t, 所 以 
总 的 时 间 复 杂 度 为 O(n 十 t); 当 t~mxn 时 ,为 Ol(mx*n), 与 通常 算 
法 的 时 间 复 杂 度 相同 ; 当 t 二 二 m x n 时 ,算法 明显 是 高 效 的 。 
当然 ,要 在 这 种 三 元 组 形式 的 顺序 存储 结构 中 插入 或 删除 一 个 
元 素 ,就 要 移动 元 素 , 这 就 比较 麻烦 了 。 如 果 要 在 这 种 存储 结构 上 施 
行 矩阵 的 加 法 、 乘 法 等 操作 ,由 于 运算 过 程 中 非 零 元 素 经 常 发 生变 
化 ,所 以 不 宜 用 三 元 组 形式 的 顺序 存储 结构 。 这 时 ,宁可 采用 占 内 存 
空间 较 多 的 二 维 数组 顺序 存储 结构 ,或 者 采用 下 面 介绍 的 十 字 链 表 。 


三 、 稀 疏 矩 阵 的 十 字 链 表 存 储 结构 


稀 朴 矩阵 的 十 字 链 表 存储 结构 是 用 多 重 链表 来 存储 矩阵 , 它 实 
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通过 AL0j], 求 出 矩阵 N 的 行 数 ， 
列 数 和 非 零 元 素数 目 赋 给 BLO] 


从 AL0j] 中 求 出 矩阵 M 的 列 数 n 和 
非 零 元 素数 目 KK 


有 非 零 元 束 吗 ? (t:0) 


有 (t 关 0) 


组 织 循 环 ,生成 数组 numl[i nj 


组 织 循环 ,生成 数组 pot[i. .nj 


组 织 循环 ,从 向 量 A 的 第 一 个 分 
量 (k 二 1) 开 始 转 峰 


无 (t==0) 


yes(k. +) 
向 量 A 全 部 转 置 完 吗 (k:t)? 


No(k<=t) 

取 A[kj] 中 的 列 号 col; 对 A[Lkj] 进 
转 置 后 把 三 元 组 存放 在 向 量 B 中 
由 potLcol] 所 指 的 位 置 ,修改 pot 


图 6-9 ” 按 矩 阵 M 的 行 序 进行 转 置 的 算法 框图 

际 上 是 三 元 组 形式 的 线性 表 的 链 式 存储 结构 ,在 这 种 存储 结构 中 , 甜 
阵 中 的 每 个 非 零 元 素 用 一 个 结 点 来 表示 ;这 种 非 零 元 素 结 点 有 五 个 
域 组 成 ,其 结构 如 图 6-10(a) 所 示 。 

其 中 行 域 (row)、 列 域 Cright) 、 值 域 Cval) 分 别 表 示 一 个 非 零 元 素 所 在 
的 行 号 、 列 号 和 值 ; 向 下 域 (down) 用 以 链接 同一 列 中 下 一 个 非 零 元 
素 的 结 点 ;向 右 域 (right) 用 以 链接 同一 行 中 下 一 个 非 零 元 素 的 结 点 。 
这 样 ,同一 行 上 的 非 零 元 素 结 点 可 通过 right 域 链接 成 一 个 带 表 头 结 
点 的 循环 链表 , 称 为 行 循环 链表 ; 同一 列 上 的 非 零 元 素 结 点 也 可 通 
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(a) 非 零 元 素 结 点 (b) 行 ( 列 ) 表 头 结 点 《〈c) 总 表 头 结 反 


图 6-10 ”十字 链表 中 的 三 种 结 点 结构 

过 down 域 链 接 成 一 个 带 表 头 结 点 的 循环 链表 , 称 为 列 循环 链表 。 为 
了 使 整个 链表 中 的 结 点 结构 一 致 ,我们 规定 行 ( 列 ) 循 环 链表 中 的 表 
头 结 点 和 表示 非 零 元 素 结 点 一 样 ,也 设 五 个 域 ,如 图 6-10(b) 所 示 。 
其 中 ,相应 的 行 域 (row) 和 列 域 (col) 规 定 为 零 ;next 域 用 以 链接 下 一 
行 ( 列 ) 循 环 链表 的 表 头 结 点 ;down 域 用 以 链接 所 在 列 循环 链表 中 第 
一 个 非 零 元 素 结 点 ;right 域 用 以 链接 所 在 行 循 环 链表 中 第 一 个 非 零 
元 素 结 点 。 从 中 可 以 看 出 每 一 列 的 列 循环 链表 中 表 头 结 点 只 需 用 一 
个 down 域 , 每 一 行 的 行 循环 链表 中 只 需 用 一 个 right 域 。 由 于 这 些 
表 头 结 点 的 row 域 、col 域 的 值 均 为 零 , 所 以 这 两 组 表 头 结 点 可 以 合 
用 ( 即 第 i 行 的 链表 和 第 i 列 的 链表 共用 一 个 表 头 结 点 )。 而 这 些 行 
( 列 ) 表 头 结 点 又 可 通过 next 域 链接 成 一 个 带头 结 点 的 循环 链表 , 称 
为 表 头 结 点 循环 链表 ;这 个 循环 链表 的 头 结 点 称 为 总 头 结 点 , 它 也 设 
五 个 域 ,如 图 6-10(c) 所 示 。 其 中 ,row 域 和 col 域 分 别 用 于 存放 抢 阵 
的 行 数 和 列 数 ;next 域 用 于 链接 第 一 行 ( 列 ?链表 的 表 头 结 点 ;另外 
两 个 域 (down .right) 在 总 表 头 绪 点 中 不 用 。 

总 之 ,在 这 种 多 重 链表 中 有 三 种 结 点 : 即 总 表 头 结 点 . 行 ( 列 ) 表 
头 结 点 和 非 零 元 素 结 点 ;另外 还 有 三 种 循环 链表 :由 各 行 ( 列 ) 表 头绪 
点 组 成 的 表 头 结 点 循环 链表 、 由 同一 行 中 的 非 零 元 素 结 点 组 成 的 行 
循环 链表 和 由 同一 列 中 的 非 零 元 素 结 点 组 成 的 列 循环 链表 。 

在 这 种 稀 朴 矩阵 的 多 重 链表 存储 结构 中 ,对 于 每 一 个 非 零 元 素 
aij 的 结 点 , 它 既 是 第 i 行 循环 链表 中 的 一 个 结 点 ,又 是 第 j 列 循环 链 
表 中 的 一 个 结 点 ,就 好 比 处 在 一 个 十 字 路 口上 ,所 以 称 这 种 多 重 链表 
为 十 字 链 表 。 如 图 6-11(a) 所 示 的 稀疏 矩阵 M ,其 十 字 链 表 存 储 结构 
如 图 6-11(b) 所 示 。 

在 图 6-11 中 , 是 指向 总 表 头 结 点 的 指针 。 通 过 h 我 们 便 可 以 
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(a) 稀 玖 矩阵 M 


HL[1] 一- HL[2] HLLT3] HL{ 4] Ss HL[ SJ] 


(b) 矩阵 M 的 十 字 链 表 


图 6-11 稀 玖 矩阵 的 十 字 链 表 存 储 结构 
得 到 该 链表 中 所 有 非 零 元 素 的 信息 。 现 在 我 们 讨论 如 何 建立 一 个 稀 
玖 箱 阵 的 十 字 链 表 问 题 ,在 建立 一 个 稀 玖 矩阵 的 十 字 链 表 时 ,首先 要 
知道 矩阵 的 行 数 、 列 数 和 非 零 元 素数 目 ; 并 且 要 知道 每 个 非 零 元 素 的 
行 号 、 列 导 和 值 。 下 面 我 们 先 大 致 描述 一 下 这 个 算法 的 思想 。( 假 设 
输入 数据 都 是 正确 的 ) 。 

1. 首先 输入 矩阵 的 行 数 m、 列 数 n 和 非 零 元 素数 目 t; 然 后 取 m 
和 n 两 者 中 较 大 一 个 赋 给 s(s 王 max{tm,n)}); 最 后 再 建立 一 个 总 表 头 
结 点 和 s 个 行 ( 列 ) 链 表 的 表 头 结 点 。 为 了 能 方便 地 随机 访问 各 行 
( 列 ) 表 头 结 点 ,另外 设立 一 个 向 量 hl[1.. sj, 其 每 个 分 量 hl[ 让 指向 
第 i 个 行 ( 列 ) 链 表 的 表 头 结 点 。 

2. 组 织 循环 ,以 行 优先 序 依 次 输入 矩阵 的 非 零 元 素 三 元 组 (r， 
c,v)。 每 输入 -个 三 元 组 , 先 建立 一 个 结 点 p, 再 把 这 个 结 点 插入 到 
行 循环 链表 和 列 循环 链表 中 。 由 于 规定 以 行 优先 序 输入 非 零 元 素 , 因 
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而 结 点 p 一 定 播 在 第 r 行 循环 链表 和 第 c 列 循环 链表 的 当前 最 后 结 
点 之 后 .为 了 能 快速 地 找到 插入 位 置 ,我 们 暂时 借用 每 个 行 ( 列 ) 链 表 
的 表 头 结 点 中 的 next 域 ,用 于 指示 每 一 列 循环 链表 中 当前 最 后 一 个 
结 点 ;并 用 一 个 变量 tl 记录 最 近 处 理 的 行 号 ,用 一 个 指针 ep 指示 最 
近 处 理 的 行 循环 链表 中 的 最 后 一 个 结 点 。 如 果 当 前 输入 的 非 零 元 素 
的 行 号 (r) 大 于 最 近 处 理 的 行 号 (x1) , 则 修改 rl 和 ep。 这 样 ,在 行 循环 
链表 中 插入 时 只 要 把 结 点 Pp 插 在 ep 所 指 结 点 之 后 ; 在 列 循环 链表 
中 插入 时 只 要 把 结 点 p 插 在 hl[c]+ .next 所 指 结 点 之 后 。 
3. 完成 表 头 结 点 循环 链表 的 链接 。 此 算法 的 框图 描述 如 图 6-12 
所 不 : 
根据 此 框图 ,下 面 我 们 用 PASCAL 语言 描述 有 关 数 据 类 型 和 此 算 
法 。 
CONST nmax 一 {允许 的 最 大 行 数 和 列 数 ); 
TYPE link= h node; 
feature = (headnode ,element); 
node==RECORD 
row ,col :integer; 
right ,down :link; 
CASE feature OF 
headnode : (next ;link ); 
clement: (val :integer) 
END 
: END:; 
PROCEDURE crt-linkmat (VAR h.link); 
VAR 
mn,s:l1..nmax; 
hl:ARRAY [1..nmax| OF link; 
tyrsc.v,rl,i:integer; 
pyep:link ; 
BEGIN 
readln (m,n,t); 
IF m;>r. THEN s;=m 
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ELSE s :一 ny; 
new (h); 
hh.row:=m; h 人 .col : 一 ni 
FOR i:=1 TO s DO 
BEGIN 
new (hl[i1]); 
hl[ij .row:=0; hifi}j .col:=0; 
hl 4 .right=hlfil]; hlfij 4 .down: =hlli]; 
hl[ij .next: =hl[i] 
END; 
rl: 一 1 yep: 一 hlLlj]; 
FOR i:=1 TOt DO 
BEGIN 
readln(r,c,v); 
new (p); 
p .row:—=r; p44.col;=c; pi.vol;=v; 
IF rl<r THEN 
BEGIN : 
rl:=r; ep: 一 hlfr] 
上 ND; 
P 不 .right: 一 ep 不 .right; 
ep 个 .right: 一 pi ep: 一 pi 
b+ .down: 王 hl[cjf+ .next 人 .down; 
hl[c] + .next .down:=p; 
hl[cj] + .next :一 P 
END; 
FOR i:=1 TO s-1 DO hl[i] 和 .next: 一 hl[i 十 1]; 
h 个 . next: 一 hlf]; 
hl[s | 4 .next: 一 h 
FEND; 

在 这 个 算法 中 ,共有 3 个 并 列 的 单 循环 ,所 以 其 时 间 复杂 度 为 0 
Cs 十 t)。 下 面 我 们 讨论 用 十字 链表 作为 稀 朴 抢 阵 的 存储 结构 时 ,如何 
实现 两 个 矩阵 的 相 加 运算 A: 王 A 十 B。 
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输入 行 数 m, 列 数 n, 非 零 元 素 
数 日 t, 求 出 s: 一 maxLm,n]; 建 
立 总 表 头 结 点 ,并 用 指针 再 指 
示 ,组 织 循环 ,建立 各 行 

( 列 ) 表 头 结 点 ,并且 指针 

向 量 hi[1..s] 指 示 ， 


最 近 行 指示 器 赋 初 值 (rl 二 1) 
当前 最 后 结 点 指针 赋 初 值 
《ep: 一 hLi) 


个 非 零 元 素 开 始 输入 (Ci<1) 


非 零 元 素 全 部 输入 完 吗 (i:t)? 


No(i< 一 t) 


| 输入 三 元 组 (re,v) 天 立 结 点 P | 
No(rl=—r) 


-… 行 是 否 处 理 完 (rl:r)? 
1 Yes(rl]<r) 


修改 rl 和 ep, (rl; 二 =r;ep; 二 hlir1) 


在 第 r 行 循环 链表 的 最 后 插入 
P 结 点 , (p 个 right; = 二 ep 个 .right 
ep 4 .right;=p;ep:=P) 

在 第 C 列 循环 链表 的 最 后 插入 
P 结 点 ,(p+ .down: 王 hl[c] 丰 
.next 对 .downihl[c] 丰 .next 人 

. down: 一 p;hlLc] + . next: =P) 


修改 i(i: 一 i 十 1) 


Yes(i>t) 


组 织 循环 ,完成 表 
头 结 点 循环 链表 的 
链接 


图 6-12 建立 十 字 链 表 的 算法 框图 
两 个 矩阵 相 加 和 第 三 日 中 讨论 的 两 个 一 元 多 项 式 相 减 极为 相 
似 , 所 不 同 的 是 -元 多 项 式 中 的 每 个 项 只 有 一 个 标 元 ( 即 指数 ) ,而 矩 
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阵 中 的 每 个 非 旦 元 有 两 个 标 元 ( 行 值 与 列 值 ), 每 个 结 点 既 在 行 表 中 
又 在 列表 中 ,致使 插入 和 删除 时 指针 的 修改 稍为 复杂 , 故 需 更 多 的 辅 
助 指针 。 

假设 矩阵 A': 二 A 十 B, 则 结果 和 矩阵 A' 中 的 非 零 元 a; 只 可 能 有 
三 种 情况 。 它 或 者 是 ai 十 bi; 或 者 是 ai(bi 王 0 时 ); 或 者 是 bi(ai 王 0 
时 )。 由 此 , 当 将 了 加 到 A 上 去 时 ,对 A 和 矩阵 的 十 字 链 表 来 说 ,或 者 是 
改变 结 点 的 val 域 值 (ai 十 b < 六 0) ,或 者 不 变 (bi 王 0) ,或 者 插入 一 
个 新 结 点 (ai 一 0 有 是 bj; 二 之 0), 还 可 能 是 删除 一 个 结 点 Cai 十 bi 二 0)。 
整个 运算 过 程 可 从 和 矩阵 的 第 一 行 起 逐 行进 行 。 对 每 一 行 都 从 行 表 头 
出 发 分 别 找到 A 和 B 在 该 行 中 第 一 个 非 零 元 结 点 后 开始 比较 ,然后 
按 上 述 四 种 不 同情 况 分 别处 理 之 (假设 指针 pa 和 pb 分 别 指向 A 和 
B 的 十 字 链 表 中 行 值 相同 的 两 个 结 点 )。 

(1) pa 不 .col 二 pb 个 .col 有 目 pa 个 .val 十 pb 个 ,val 过 二 0, 则 只 要 将 
ai 十 bs 的 值 送 到 pa 所 指 结 点 的 值 域 中 即 可 ,其 它 所 有 域 的 值 都 不 变 。 

(2) pa 和 .col=pb 人 .col pa . Val 十 pb 个 .val 二 0, 则 需要 在 A 
矩阵 的 链表 中 删除 pa 所 指 的 结 点 。 此 时 , 需 改变 同一 行 中 前 一 结 扩 
的 right 域 值 ,以 及 同一 列 中 前 一 结 点 的 down 域 值 。 

(3) pa 个 .col 二 pb 个 .col 且 paf+ ,col 和 >>0, 则 只 要 将 pa 指针 往 
右 推进 一 步 ,并 重新 加 以 比较 。 

(4)pa 人 不 .col>>pb 个 .col 或 pa 个.col 二 0, 则 和 需 在 A 和 矩阵 的 链表 中 
插 和 人 一 个 值 为 bi 的 结 点 。 此 时 需 改 变相 应 的 指针 。 

为 了 便于 插入 和 删除 结 点 ,还 需 设立 一 些 辅 助 指 针 。 其 一 ,在 A 
的 行 链表 上 设 qa 以 指示 pa 所 指 结 点 的 前 驱 结 点 ;其 二 ,在 A 的 每 一 
列 的 列 链表 上 设 一 个 指针 hl[j] 它 的 初 值 是 指向 每 一 列 的 列 链 表 的 
表 头 结 点 。 

下 面 对 将 和 抢 阵 也 加 到 和 矩阵 A 上 的 操作 过 程 大 致 描述 如 下 : 

设 ha 和 hb 分 别 为 表示 和 抢 阵 A 和 了 的 十 字 链 表 的 头 指 针 ;ca 和 
cb 分 别 为 指向 A 和 B 的 行 链表 的 表 头 结 点 的 指针 ,其 初始 状态 为 : 
ca :一 ha 人 .next;jcb: 王 hb 个 .next; 
pa 和 pb 分 别 为 指向 A 和 B 的 链表 中 结 点 的 指针 。 

和 


(1) 令 pa 和 pb 分 别 指向 A 和 B 的 链表 中 第 一 行 的 第 一 个 非 零 
元 素 的 结 点 , 即 
pa;=ca 人 .right;pb;=cb .right; 
若 B 的 该 行 中 无 非 零 元 素 的 结 点 , 即 pb 人 .col 王 0, 则 令 ca 和 cb 名 
自转 指 回 下 一 行 , 即 
ca: 一 ca 人 .nextycb: 一 cb 个 .next; 
(2) 否则 ,比较 这 两 个 结 点 的 列 序号 ,这 时 可 能 有 三 种 情况 : 
@ 若 pa 个 .col 二 pb 个 .col 且 paf+.col<< 盖 0, 则 令 pa 指向 本 行 下 
一 结 点 , 即 
qa:=pa;pa:=pa‘.right; 
@ 若 pa 个 .col 汪 pb 个,col 或 pa 个 .col 二 0( 即 A 的 这 一 行 中 非 零 
元 已 处 理 完 ), 则 需 在 A 中 插入 一 个 结 点 。 假设 新 结 点 由 指针 
p 指示 , 则 A 的 行 表 中 的 指针 变化 状况 为 :; 
qa .right:=p;p .right: =pa; 
A 的 列表 中 的 指针 也 要 作 相 应 的 改变 。 首 先 需 找到 同一 列 中 
上 一 个 结 点 ,并 且 令 hlLj] 指 向 该 结 点 。 于 是 A 的 列表 指针 修 
改 为 : 
p 人 不 .down:==hl[j] 个 .down;hbl[j] .down:=p; 
@ 若 pa 个 .col 二 pb 个 .col, 则 将 BB 中 的 这 个 非 零 元 的 值 加 到 A 的 
相应 非 零 元 上 , 即 
pa 个 .val:;= 二 pa 个 .val 十 pb 个 .val; 
此 时 车 pa .val 二 二 0, 则 指针 不 变 ;否则 , 需 删 除 A 中 该 结 
点 。 于 是 行 表 中 指针 变 为 : 
qa 人 .right 一 pa 个 .right; 
同时 ,为 了 改变 列表 中 的 指针 ,需要 先 找 同 一 列 中 上 一 个 结 
点 , 且 令 hlUj 指向 该 结 点 ,然后 令 : 
hl[j | 人 .down: 一 pa 个 .down; 
〈3) 重 复 步 又 (2), 直 至 忆 的 同一 行 中 非 零 元 处 理 完 为 止 , 然 后 
再 转 回 下 一 行 。 以 此 类 推 , 直 至 m 行 都 处 理 完 为 止 。 此 时 的 标志 是 ca 
和 cb 重 又 指向 十 字 链 表 的 头 结 点 , 即 
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ca 一 ha 或 cb 一 hb; 
该 算法 的 框图 描述 如 图 6-13 所 示 


组 织 循环 ,建立 hl 向 量 


caycb 赋 初 值 ， 


ca: 一 ha 人 .next; 


cb:; 一 hb + 人. next 


Yes(ca=ha) 


各 行 均 查 完 吗 (ca.:ha7> 
建立 pa， 


No(ca 天 ha) 
pa: 一 ca 


b 和 和 a: 
pb:=cb¢. right;ga=ca 


.right; 


Yes(pb=cb) 


pa 个 .col>>ph 不 . col 或 pa 二 ca 


比较 pa,pb 所 指 元 素 的 列 号 


生成 一 个 新 结 点 P, 复 
抄 pb 所 指 结 点 的 三 元 
组 P 结 点 ,再 把 P 结 点 
插 人 到 A 行 , 列 链表 

中 ;修改 pb, 使 其 指 
向 下 一 个 结 


对 A 收 改行 链表 , 列 链表 
中 的 有 关 指 针 ,删除 这 个 
结 点 然后 修改 pa,Pb 指 

针 , 使 其 指向 下 一 个 结 点 


图 6-13 ”十字 链表 表示 的 稀 玖 和 矩阵 相 加 算法 框图 
根据 此 框图 ,下 面 我 们 用 PASCAL 语言 描述 此 算法 。 
PROCEDURE add-linkmat(VAR ha:link; hb:link); 
VAR 
pa,pb,qa,ca,cb,q:link;hl:ARRARYI[1...nmax| OF link; 
1,] :lnteger; 
BEGIN 
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p:=ha‘.next; i:=1; 
WHILE p< >ha DO 
BEGIN 
hI], =p; 
p:—=p .next; 
1: 二 1 十 1 
END,; 
ca ;一 ha 人 . next; cb:=hb .next; 
WHILE ca=>ha DO 
BEGIN. 
pa:=ca¢ .right; pb:—=cb .right; qa:=ca; 
WHILE pb<=<>cb DO 
IF (pa+ .col>pb .col) OR (pa 一 ca) THEN 
BEGIN 
new(p); pA.row:=pb .row; p¢.col:=pb+.col; 
p 个 .val; 二 pb 个 .val; 
qa 人 .right:=p; p¢.right:=pa; qa:=p; 
j:=p.col; q:=hl[j]j .down; 
WHILE (qf+ .row<=>0) AND (qf+ .row<p+ .row) DO 
BEGIN 
hl[j]:=q; q:=q^.down 
END; 
hl[jj 4 .down:=p; p¢^.down:=q; 
hl[jj:=p; 
pb :一 pb 人 .right 
END 
ELSE 
IF (pa+ .col<pb+ .col) THEN 
BEGIN 
qa:=pa; pa:=pa‘ .right 
END 
ELSE 
BEGIN 
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pa .val: 一 pa 人 + .val 十 pb 人 .val 
IF pa ,val=0 THEN 
BEGIN 
qa 和 ,right:=pa .right; 
起 二 pa 个 .col; q; 二 hl[}j] 个 .down; 
WHILE (qt.row<pa .row) DO 


BEGIN 
hl[jj:=q; q:=q .down 
END; 
hi[j] .down: =q+.down; 
dispose (pa); 
pa:=qa 人 .right; pb:=pb .right 
END 
ELSE 
BEGIN 


qa:=pa; pa:=pa‘. right; 
pb:=pb 人 。 right 


END 
END; 
ca: 一 ca 水 .nexty Bb 村 .next 
END 
END:; 


从 上 述 过 程 可 以 看 出 ,对 于 一 个 结 点 来 说 ,进行 比较 .修改 指针 
所 需 的 时 间 是 -个 常数 。 整 个 过 程 主要 是 对 ha 和 hb 两 个 十 字 链 表 
的 逐 行 打 描 ,因此 ,其 循环 次 数 主要 取决 于 A 和 了 BB 和 矩阵 中 非 零 元 素 


的 个 数 ta 和 tb; 因 此 算法 的 时 间 复 杂 度 为 Ota 十 tb)。 


习 题 


1. 编写 一 个 用 三 元 组 形式 表示 的 两 个 稀 政和 矩阵 M 和 N 相 乘 的 


算法 。 结 果 存 放 在 二 维 数组 中 。 


2. 与 一 个 算法 ,其 功能 为 访问 稀疏 和 矩阵 的 十 字 链 表 中 每 一 个 元 
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素 ,访问 时 要 求 打印 元 素 的 行 号 、 列 号 和 元 素 但 。 

3. 若 在 mxn 的 矩阵 中 某 一 个 元 素 ai 满足 以 下 条 件 :mi 既是 第 i 
行 各 元 素 中 的 最 小 值 ,又 是 第 j 列 各 元 素 中 的 最 大 值 , 则 称 
此 为 矩阵 的 鞍点 。 试 写 一 个 算法 , 求 出 算 阵 中 的 鞍点 ; 右 该 甜 
阵 不 存在 蔷 点 , 则 给 出 相应 的 信息 。 

4. 将 下 列 稀 慌 矩阵 A 表示 成 十 字 链 表 。 


0 10 0 5 
0 .0 0 4 0 
A=|0 0 0 0 0 
2 .0 0 0 0 
0 3 0 一 2 0 
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第 七 日 树 


前 面 , 我 们 主要 讨论 了 线性 表 、 栈 、 队 列 等 一 些 线性 结构 。 然 而 ， 
在 实际 应 用 中 我 们 还 常常 会 碰 到 一 些 问 题 ,需要 用 非 线性 结构 描述 。 
所 谓 非 线性 结构 就 是 说 在 这 种 结构 中 ,至 少 存在 一 个 元 素 有 两 个 或 
两 个 以 上 的 直接 前 驱 ( 或 后 继 ) 。 树 型 结构 就 是 其 中 一 类 重要 的 非 线 
性 数据 结构 。 本 日 主要 讨论 二 叉 树 的 存储 结构 及 其 各 种 操作 ,并 研究 
树 和 森林 与 二 叉 树 之 间 的 转换 关系 ,最 后 将 介绍 几 个 有 关 二 叉 树 的 
典型 应 用 例子 。 


7.1 树 型 结构 的 基本 概念 和 基本 操作 


一 、 树 的 定义 和 表示 形式 


树 是 nn 之 0) 个 结 点 的 有 限 集 。 当 n 一 0 时 , 称 为 空 树 ; 当 n 之 0 
时 ,一 棵 树 中 ,有 且 仅 有 一 个 特定 的 称 为 根 的 结 点 ， 而 除根 以 外 的 其 
他 结 点 可 分 为 mm 之 0) 个 互 不 相交 的 有 限 集 Ti、T、 …、ITn, 其 中 每 
个 有 限 集 本 身 又 是 一 棵 树 ,并且 称 为 根 的 子 树 。 例 如 ,在 图 7-1 中 ， 
《a) 是 只 有 一 个 根 结 点 的 树 ;(b) 是 有 10 个 结 点 的 树 , 其 中 A 是 根 ， 
其 余 结 点 分 成 三 个 互 不 相交 的 有 限 集 :T= {B,E,F,J]),Ts={C},T; 
二 {D,G,H,1)。Ti,T,,Ts 本 身 又 都 是 一 棵 树 , 都 称 为 根 结 点 A 的 子 
树 。 例 如 ,Ti 是 一 棵 树 , 其 根 为 B ,其余 结 点 分 成 两 个 互 不 相交 的 有 
限 集 Ti1 二 {下 } ,Tz 二 4F,J)。Tu,T 了 iz 都 是 B 的 子 树 ,Ti 是 只 有 根 结 后 
E 的 树 ;在 树 Tiz 中 ,F 为 根 ,F 有 一 棵 只 有 根 结 点 J 的 子 树 。 

在 树 的 定义 中 又 用 到 了 树 的 概念 ,所 以 这 是 一 个 递归 的 定义 ;这 
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(A) 

BB (OO {9D 

BD OYO 
和 


(a) 只 有 根 的 树 (b) 一 般 树 


I@ 


图 7-1 树 的 示例 

也 说 明了 树 的 固有 特性 ,在 树 中 每 一 个 结 点 都 是 该 树 中 的 某 一 棵 子 
树 的 根 。 

对 于 一 棵 树 ,我 们 有 多 种 表示 形式 。 图 7-1 所 示 是 一 种 树 形 表示 
法 , 它 将 根 结 点 画 在 最 上 面 ,形似 一 棵 倒 悬 的 自然 界 中 的 树 。 在 本 书 ， 
中 一 般 都 采用 这 种 表示 法 。 除 此 以 外 ,还 有 其 他 一 些 表示 形式 ,图 7-2 
所 示 为 图 7-1 中 (b) 树 的 其 他 表示 形式 。 其 中 , (a) 为 嵌 套 集合 的 文 氏 
图 表示 法 ,(b) 为 广义 表 形 式 表示 法 ，(c) 为 凹 人 表示 法 。 


二 、 树 的 基本 术语 


_ 树 的 结 点 包含 一 个 数据 元 素 以 及 若干 指向 其 子 树 的 分 支 。 结 点 
拥有 的 子 树 数 称 为 结 点 的 度 。 例如 ,在 图 7-1(b) 中 结 点 A 的 度 为 3， 
结 点 B 的 度 为 2, 结 点 C 的 度 为 0。 我 们 把 度 为 0 的 结 点 称 为 叶子 (或 
终端 结 点 ) 。 在 图 7-2(b) 中 , 结 点 C.G.HIE.J 都 是 叶子 。 另外 我 们 
把 树 中 度 不 为 0 的 结 点 称 为 非 终 端 结 点 (或 分 支 结 点 ) 。 除 根 结 点 之 
外 的 分 支 结 点 称 为 内 结 点 。 在 树 中 各 结 点 的 最 大 值 称 为 树 的 度 ， 如 
图 7-1(b) 所 示 的 树 , 其 度 为 3。 树 中 任 一 结 点 的 子 树 的 根 称 为 该 结 
点 的 孩子 ;反之 ,该 结 点 称 为 其 孩子 的 双亲 。 例如 ,在 图 7-1(b) 中 , 结 
点 B 为 结 点 A 的 子 树 Ti 的 根 ,所 以 B 称 为 A 的 孩子 ,A 称 为 B 的 
双亲 。 同 一 双亲 的 孩子 之 间 互 称 为 兄弟 。 例如 ,G、H.I 互 为 兄弟 .将 
这 些 关系 进一步 推广 ,可 认为 B 是 本 的 祖先 。 结 点 的 祖先 是 从 根 到 该 
结 点 所 经 分 支 上 的 所 有 结 点 。 例如 ,J 的 祖先 为 A、.B.F。 反之 以 某 结 
点 为 根 的 子 树 中 的 所 有 结 点 都 称 为 该 结 点 的 子孙 ,例如 ,B 的 子孙 为 
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(a) 文 氏 图 表示 法 (c) 种 人 表示 法 
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(A(B(E,F(OD)),C,DGG,H,D)) 
(b) 广义 表 形式 表示 法 


图 7-2 树 的 其 它 三 种 表示 形式 

E.R] 

结 点 的 层次 从 根 开始 定义 , 根 为 第 一 层 , 根 的 孩子 为 第 二 层 ;大 
某 结 点 在 第 k 层 , 则 其 孩子 就 在 第 上 十 1 层 。 在 一 棵 树 中 ,双亲 在 同一 
层 的 结 点 互 称 为 党 兄弟 。 例 如 , 结 点 下 .F.G、H\I 互 为 堂 兄弟 。 树 中 
结 点 的 最 大 层次 称 为 树 的 深度 (或 高 度 ) 。 图 7-1(b) 所 示 的 树 , 其 深 
度 为 4。 

在 树 工 中 ,如 果 各 结 点 的 子 树 间 的 相对 次 序 是 有 意义 的 , 则 称 
工 为 有 序 树 ; 和 否则 , 称 为 无 序 树 。 对 于 有 序 树 ,改变 子 树 间 的 相对 次 
序 ,就 变 成 了 另外 一 棵 树 。 

森林 是 mCm 宇 0) 棵 互 不 相交 的 树 的 集合 。 森林 的 概念 与 树 非常 
接近 ,只 要 把 一 棵 树 的 根 结 点 去 掉 ， 就 可 以 变 成 森林 。 例如 ,如 图 
7-1(b) 中 的 树 , 去 掉 A 就 成 为 由 三 棵 树 组 成 的 森林 ;反之 ， 如 果 把 由 
m 棵 树 组 成 的 森林 ,加 上 一 个 根 结 点 而 把 这 m 棵 树 作为 此 根 的 子 
树 ， 则 使 森林 变 成 了 树 。 
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三 、 树 的 基本 操作 
树 的 基本 操作 有 下 列 几 种 : 


]. 
2 


9. 


初始 化 (initiate(T)): 置 工 为 空 树 。 

求 根 函数 (root(T) 或 root(x)); 求 树 工 的 根 或 求 结 点 x 所 在 
的 树 的 根 结 点 。 若 工 是 一 棵 空 树 或 x 不 在 任何 一 棵 树 上 , 则 
吨 数 值 为 “ 空 。 


. 求 双 亲 函 数 (parent(T,x)): 求 树 工 中 结 点 x 的 双亲 结 点 。 若 


结 点 x 是 树 T 的 根 结 点 或 结 点 x 不 在 树 T 中 , 则 函数 值 为 


pt 


全 


. 求 孩子 结 点 (child(T,x,iD): 求 树 工 中 结 点 x 的 第 i 个 孩子 结 


点 。 若 结 点 x 是 树 工 的 叶子 或 无 第 i 个 孩子 或 结 点 x 不 在 树 
工 中 , 则 函数 值 为 “ 空 。 


. 求 右 兄弟 函数 (right-sibling(T,x)): 求 树 工 中 结 点 x 右边 的 


兄弟 。 操 结 点 x 是 其 双亲 的 最 右边 的 孩子 结 点 或 结 点 x 不 在 
树 工 中 , 则 函数 值 为 “ 空 ?。 


， 建树 (crt-tree (x,F)); 生 成 一 棵 以 x 结 点 为 根 ,以 森林 F 为 


子 树 森 林 的 树 。 


: 插 人 子 树 操作 (ins-child(y,i',x)): 置 以 结 点 x 为 根 的 树 为 结 


点 了 的 第 i 棵 子 树 。 若 原 树 中 无 结 点 y 或 结 点 y 的 子 树 个 数 
<i-l1, 则 空 操作 。 


. 删除 子 树 操作 (del-child(x,i)) :删除 结 点 x 的 第 i 棵 子 树 。 若 


无 结 点 x 或 结 点 x 的 子 树 个 数 少 于 i, 则 空 操 作 。 
遍历 操作 (traverse(T)); 按 某 个 次 序 依次 访问 树 中 各 个 结 
点 ,并 使 每 个 结 点 只 被 访问 一 次 。 


树 的 应 用 十 分 广泛 ,在 不 同 的 应 用 中 树 的 操作 不 尽 相同 。 因 此 ， 
树 的 存储 结构 可 随 需要 而 设 定 。 


四 、 树 的 存储 结构 
树 的 存储 结构 根据 应 用 的 不 同 , 有 多 种 形式 。 在 此 ,我 们 介绍 如 


“Oo 


下 三 种 比较 常用 的 方法 。 
1. 双亲 表示 法 z 
在 这 种 方法 中 ,用 一 组 连续 的 存储 单元 存储 树 中 的 结 点 , 结 点 的 


形式 如 下 : 


其 中 ,data 用 于 存放 有 关 结 点 本 身 的 信息 ,parent 用 于 指示 该 结 反 的 
双亲 位 置 。 例 如 ,图 7-1(b) 所 示 的 树 , 其 双亲 表示 法 如 图 7-3 所 示 。 
这 种 存储 结构 利用 了 每 个 结 点 
(除根 以 外 ) 只 有 唯一 双亲 的 性 质 。 在 
这 种 存储 结构 下 , 求 结 点 的 双亲 十 分 
方便 ,也 很 容易 求 树 的 根 。 但 是 在 这 种 
区 表示 法 中 ,在 求 结 点 的 孩子 时 需要 过 
” 历 整 个 向 量 。 
2， 孩子 表示 法 
由 于 树 中 每 个 结 点 可 能 有 多 个 孩 
图 7-3 树 的 双亲 表示 法 。 子 ,所 以 自然 想到 用 多 重 链表 存储 树 。 
在 这 种 多 重 链表 的 每 个 结 点 中 除了 用 于 存放 数据 信息 的 data 域外 ， 
还 有 若干 指针 域 ,分 别 用 于 指向 该 结 点 的 孩子 结 点 。 但 是 一 棵 树 中 ， 
不 同 结 点 的 度数 是 不 同 的 ,那么 每 个 结 点 中 到 底 需 要 多 少 个 指针 域 
呢 ? 我 们 有 如 下 二 种 方案 : 
(1) 定 长 结 点 的 多 重 链表 
在 这 种 方法 中 ,我 们 取 树 的 度数 作为 每 个 结 点 的 指针 域 数 目 .不 
难 推导 ,一 棵 具有 n 个 结 点 的 度 为 k 的 树 中 必 有 nCk-1) 十 1 个 空 指 
针 . 显然 ,这 会 造成 存储 空间 的 极 大 浪费 ,例如 ,图 7-1(b) 所 示 的 树 ， 
其 定 长 结 点 的 多 重 链 表 如 图 7-4(a) 所 示 。 
(2) 不 定 长 结 点 的 多 重 链表 
在 定 长 结 点 的 多 重 链表 中 ,由 于 各 结 点 指针 的 数目 是 根据 树 的 
度 而 定 , 所 以 造成 了 存储 空间 的 浪费 。 下 面 我 们 考虑 每 个 结 点 的 指针 
域 数目 取 它 自己 的 度数 ;另外 ,在 每 个 结 点 中 设置 一 个 度数 域 (de- 
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gree)， 以 指出 该 结 点 的 度数 ,其 表示 方法 如 图 7.4(b) 所 示 ， 显 然 这 
种 方法 的 存储 密度 较 前 者 有 所 提高 ;但 由 于 各 结 点 的 结构 不 同 ,自然 
会 造成 操作 上 :的 不 方便 ，。 

结 点 形式 ，; 


are] childi] J ehildn 


结 点 形式 ， 


(b) 不 定 长 结 点 多 重 链 表 


图 7-4 树 的 多 重 链表 存储 结构 


3， 孩子 -兄弟 表示 法 

这 种 方法 又 称 二 叉 树 表示 法 (或 二 叉 链 表 表 示 法 )。 在 这 种 二 叉 
链表 的 每 个 结 点 中 除了 用 于 存放 数据 信息 的 data 域外 ,还 有 两 个 指 
针 域 fch 和 nsib, 分 别 用 于 指向 该 结 点 的 第 一 个 孩子 结 点 和 它 的 下 
一 个 兄弟 结 点 。 图 7-5 为 图 7-1(b) 所 示 树 的 孩子 -兄弟 链表 。 在 这 种 
存储 结构 中 , 树 的 操作 比较 方便 , 且 存 储 密度 较 高 。 


结 点 形式 : 
datal] Ta 


图 7-5 树 的 孩子 -兄弟 链表 存储 结构 
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7.2 二 又 树 


二 叉 树 是 一 种 应 用 广泛 的 特殊 的 树 形 结构 , 它 的 特点 是 每 个 结 
点 最 多 只 能 有 两 个 孩子 。 在 二 叉 树 中 ,必须 严格 区 分 左右 孩子 ,其 次 
序 不 能 颠倒 , 佑 改变 次 序 则 变 成 另 一 棵 二 又 树 。 


一 、 二 又 树 的 定义 和 基本 操作 


二 叉 树 是 n(n 宇 0) 个 结 点 的 有 限 集合 。 当 n= 二 0 时 称 为 空 二 又 
树 ;否则 ,二 叉 树 是 由 一 个 根 结 点 和 至 多 两 棵 互 不 相交 的 被 称 为 该 根 
的 也 为 二 叉 树 的 左 子 树 和 右 子 树 组 成 。 图 7-6 列 出 了 二 叉 树 的 五 种 
基本 形态 。 


(a) (Cb) (Cc) (d) (e) 


图 7-6 二 叉 树 的 五 种 基本 形态 
其 中 ,Ca) 为 空 二 叉 树 ;(b) 为 只 有 根 结 点 的 二 叉 树 ;(c) 为 右 子 树 为 空 
的 二 叉 树 ;(d) 为 左右 子 树 都 非 空 的 二 叉 树 ;(e) 为 左 子 树 为 空 的 二 叉 
树 。 

二 叉 树 的 基本 操作 和 树 的 基本 操作 类 似 。 下 面 我 们 分 别 介绍 : 

1. 初始 化 操作 (initiate(BT)): 置 BT 为 空 二 叉 树 。 

2. 求 根 函数 (root(x)): 求 结 点 x 所 在 二 叉 树 的 根 结 点 。 若 x 不 
在 任何 二 又 树 上 , 则 函数 值 为 “ 空 ”。 

3. 求 双亲 函数 (parent(BT,x)):; 求 二 叉 树 BT 中 结 点 x 的 双亲 
结 点 。 若 结 点 x 是 二 叉 树 BT 的 根 结 点 或 二 叉 树 BT 中 无 x 
结 点 , 则 函数 值 为 “ 空 ”。 

4. 求 孩子 结 点 函数 (lchild(BT,x) 及 rchild (BT,x));: 分 别 求 二 
叉 树 BT 中 结 点 x 的 左 孩 子 及 右 孩 子 结 点 。 若 结 点 x 没有 左 
孩子 及 右 孩 子 或 x 不 在 二 又 树 BT 中 , 则 函数 值 为 “ 空 ”。 
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. 求 兄弟 需 数 (lsibling(BT,x) 及 rsibling(BT,x)) :分别 求 二 又 
树 BT 中 结 点 x 的 左 兄弟 及 右 兄弟 结 点 。 厂 结 点 x 是 根 结 点 
或 不 在 BT 中 ,或 其 没有 左 兄 第 及 右 兄 弟 , 则 函数 值 为 * 空 ”。 

6， 建树 操作 (crt-bt(x,LBT,RBT)): 生成 一 棵 以 结 点 x 为 根 ， 
二 义 树 LBT 、RBT 分 别 为 其 左 , 右 子 树 的 二 又 树 。 

7. 搬入 子 树 操作 (ins-lchild (BT,y,x) 及 ins-rchild (BT,y,x)): 
将 以 结 点 x 为 根 且 右 子 树 为 至 的 二 叉 树 分 别 置 为 二 又 树 BT 
中 结 点 y 的 左 子 树 及 右 子 树 。 若 结 点 y 已 经 有 左 子 树 及 右 子 
树 , 则 插入 后 ,原来 y 的 左 子 树 及 右 子 树 置 为 x 的 右 子 树 ;大 
y 不 在 BT 中 ， 则 为 空 操作 。 

8. 删除 子 树 操作 (del-lchild (BT,x) 及 del-rchild (BT,x)); 分 别 
删除 二 义 树 BT 中 以 结 点 x 为 根 的 x 的 左 子 树 及 右 子 树 。 奋 
x 无 左 李 树 及 右 子 树 、 或 x 不 在 BT 中 , 则 为 空 操作 。 

9. 遍历 操作 (traverse (BT)) : 按 某 个 次 序 依次 访问 二 又 树 中 各 

个 结 点 .并 使 每 个 结 点 只 被 访问 一 次 。 


二 ,二叉树 的 性 质 


二 叉 树 具有 许多 重要 性 质 , 下 面 作 简单 的 讨论 : 
1. 在 一 棵 . - 叉 树 中 ,第 i 层 的 结 点 数 最 多 为 2“(i 之 1)。 


例如 层次 i 第 i1 层 最 多 结 点 数 
1 2 ”三 1 
2 2 “二 2 
3 2 ”一 4 
h ps 


这 个 性 质 可 以 用 数学 归纳 法 进行 证 明 ， 
当 i=1 时 ,只 有 一 个 根 结 点 ,显然 2-: 一 2 一 1, 命 题 成 立 。 
现 假设 对 所 有 的 i,1 二 =i<k, 命 题 成 立 , 即 第 k 一 1 层 上 最 多 有 
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2 一 个 结 点 。 由 于 二 叉 树 中 每 个 结 点 的 度 最 多 为 2, 所 以 第 k 层 上 的 
最 大 结 点 数 为 第 k 一 1 层 上 的 最 大 结 点 数 的 2 倍 , 即 2* 2 一 一 2 一 :。 
由 此 可 见 , 命 题 成 立 。 
2. 深度 为 h 的 二 叉 树 上 结 点 总 数 最 多 为 2 一 1 
由 性 质 1 可 见 , 若 将 二 叉 树 中 每 一 层 上 结 点 的 最 大 数 相 加 ,结果 


就 为 二 叉 树 上 结 点 的 最 大 数 。 
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h 


2 (第 i 层 上 的 最 大 结 点 数 )== 242! 二 2" 一 1 


(c) 非 完 全 二 叉 树 . 


7-7 二 叉 树 示例 


1 一 1 


如 条 一 棵 深度 为 h 的 二 


叉 树 ,共有 2 一 1 个 结 点 , 则 


此 二 叉 树 称 为 满 二 叉 树 。 若 
对 一 棵 满 二 叉 树 ,从 第 1 层 
开始 , 自 上 而 下 ,从 左 到 右 地 
对 结 点 进行 连续 编号 ,就 得 
到 了 二 叉 树 结 点 的 顺序 编 
号 。 例 如 ,图 7-7(a) 是 一 棵 深 
度 为 4 的 满 二 叉 树 ,并 对 结 
点 进行 了 顺序 编号 。 

如 果 深 度 为 h 的 有 nm 个 
结 点 的 二 叉 树 ,能够 与 深度 
为 h 的 顺序 编号 的 满 二 又 树 
从 编号 1 到 nn 的 结 点 相对 
应 , 则 这 样 的 二 叉 树 称 为 完 
全 二 义 树 。 图 7-7(b) 所 示 为 
一 棵 深度 为 4 的 完全 二 叉 
树 。 可 以 看 出 ,在 完全 二 叉 树 
中 ,叶子 结 点 只 可 能 在 层次 
最 大 的 两 层 上 出 现 ; 并 且 对 
于 树 中 的 任 一 结 点 , 若 其 右 
分 支 下 子孙 的 最 大 层次 为 1， 


则 其 左 分 支 下 子孙 的 最 大 层次 为 1 或 1 十 1。 但 满足 这 二 点 的 二 叉 树 
不 一 定 是 完全 二 叉 树 ,如 图 7-7(c) 所 示 为 一 棵 非 完全 二 叉 树 。 
3. 对 于 任何 一 棵 二 叉 树 BT, 设 no\ni\ns 分 别 是 其 度数 为 0、1、2 
的 结 点 数 。 则 有 : no 二 ns 十 1 
证 明 ;因为 在 - :又 树 中 ,任何 结 点 的 度 均 小 于 或 等 于 2， 所 以 二 叉 树 
中 结 点 总 数 为 : 
n= 二 no 十 ni 十 n， (7-1) 
设 也 为 二 叉 树 中 分 支 总 数目 。 由 于 在 二 叉 树 中 除根 结 点 外 ,其 余 结 
点 都 有 一 个 分 支 进 入 ,所 以 ,B==n 一 1, 即 ;n= 二 B 十 1。 而 这 些 分 支 只 能 
是 由 度 为 1 或 2 的 结 点 所 发 出 ,所 以 ,B==ni 十 2ns, 即 : 
n 一 mn 十 2n? 十 1 C72 
由 (8 一 1) 式 和 (8 一 2) 式 得 ;no 二 ns 十 1 
4. 具有 n 个 结 点 的 完全 二 叉 树 的 深度 为 Llog2n | 十 1 
设 其 深度 为 h, 根据 性 质 2 和 完全 二 叉 树 的 定义 有 : 
2 1—1<n<=2*—1 即 2 1! 之 二 n 之 2*, 所 以 h 一 1 过 
一 log2n<<h, 又 因为 h 是 整数 ,所 以 h=[log2n | 十 1。 
5. 如 果 对 一 棵 具有 n 个 结 点 的 完全 二 叉 树 的 结 点 进行 顺序 编 
号 ( 自 上 而 下 ,从 左 到 右 进行 编号 ) , 则 其 中 任 一 结 点 i(1 志 i<n) 有 : 
(1) 如 果 i 王 1, 则 结 点 1 是 二 叉 树 的 根 , 无 双亲 ;如 果 i 汪 1, 则 其 
双亲 parent(i) 的 编号 为 Li/24。 

(2) 如 果 2i>n, 则 结 点 i 无 左 孩 子 ( 结 点 i 为 叶子 结 点 ); 否 则 其 
左 孩 子 lIchild Gi) 的 编号 为 2i。 

(3) 如 果 2i 十 1>n, 则 结 点 1 无 右 孩 子 ;否则 右 孩 子 rchild (i) 的 
编号 为 2i 十 1。 下 面 先 用 数学 归纳 法 证 明 (2) 和 (3): 

对 于 i==1, 由 完全 二 叉 树 的 定义 ,其 左 孩 子 编号 为 2, 右 孩子 纺 
号 为 3。 如果 2 之 n, 则 说 明 i 无 左 、 右 孩子 ;如 果 3 之 n, 则 说 明 i 无 右 
孩子 ,可 见 命题 (2) 和 (3) 成 立 。 

设 i=k(k 这 二 1) 时 ,命题 (2) 和 和 (3) 成立。 即 2k 十 1 过 n 时 ,k 的 左 
孩子 编号 为 2k、 右 孩子 编号 为 下 十 1。 则 当 i=k 十 1 时 ,车 它 有 左 孩 
子 , 则 编号 必 为 (2k 十 1) 十 1 二 2(k 十 1) ;车 它 有 右 孩 子 , 则 编号 必 为 
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(2k 十 1) 十 2 王 2(k 十 1) 十 1, 所 以 命题 (2) 和 (3) 成 立 。 
由 命题 (2) 和 (3) ,显然 可 推出 命题 (1)。 


、 二 叉 树 的 存储 结构 


对 于 二 又 例 我 们 可 以 用 顺序 存储 结构 存储 ,也 可 以 用 链 式 存储 
结构 存储 。 下 面 分 别 进行 讨论 。 

1. 二 叉 树 的 顺序 存储 结构 

对 二 叉 树 进行 顺序 存储 时 ,需要 用 一 组 连续 的 存储 单元 存储 二 
叉 树 的 结 点 中 的 数据 。 例 如 ,图 7-7(b) 所 示 的 完全 二 叉 树 ,可 以 用 同 
量 bt[1..10] 作 它 的 存储 结构 ,将 二 叉 树 中 编号 为 1 的 结 点 中 的 数据 
存放 在 分 量 bt[ij 中 ,如 图 7-8(a) 所 示 。 


als[4l slel7rlsloho 根据 完全 二 又 树 的 特 
(a) 完全 二 叉 树 性 , 结 点 在 向 量 中 的 相对 

位 置 蕴 含 着 结 点 之 间 的 关 

(b) pg 系 。 如 btL4j] 的 双亲 存放 在 
bt[2] 中 ,而 其 左右 孩子 存 

图 7-8 二 又 树 的 顺序 存储 结构 放 在 bt[8] 和 bt[9]。 对 于 


满 二 叉 树 和 完全 二 叉 树 ,用 这 种 存储 结构 显然 是 比较 适合 的 。 它 既 不 
浪费 内 存 ,又 可 以 利用 地 址 公式 确定 其 结 点 的 存储 位 置 。 然 而 ,对 于 
一 般 的 二 叉 树 而 言 ,顺序 存储 常常 会 造成 内 存 的 浪费 。 例 如 ,图 7-7 
(c) 所 示 的 二 又 树 ,其 顺序 存储 结构 如 图 7-8Cb) 所 示 。 其 中 有 三 个 单 
元 浪费 ,在 最 坏 的 情况 下 ,一 棵 深度 为 h 只 有 h 个 结 点 的 单 支 树 《〈 树 
中 无 度 为 2 的 结 点 ), 需 要 2 一 1 个 存储 分 量 。 如 图 7-9(a) 所 示 的 二 
叉 树 ,其 顺序 存储 结构 如 图 7-9(b) 所 示 。 该 二 叉 树 只 有 四 个 结 点 , 却 
需 开辟 15 个 结 点 的 空间 。 显 然 ,空间 浪费 很 大 。 

另外 ,对 于 二 叉 树 顺序 存储 结构 ,插入 和 删除 是 很 不 方便 的 。 所 
以 一 般 情况 下 ,二叉树 采用 链 式 存储 结构 。 

2. 二 叉 树 的 链 式 存储 结构 

在 二 叉 树 的 链 式 存储 结构 中 ,二 叉 树 中 的 每 一 个 结 点 在 链表 中 
用 一 个 结 点 表示 .每 个 结 点 有 多 少 个 域 可 以 根据 需要 来 设计 ,一 般 定 
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(a) 单 支 树 (b) 单 支 树 的 顺序 存储 结构 


图 7-9 单 支 树 及 其 顺序 存储 结构 

为 三 个 域 ,如 图 7-10(a) 所 示 。 其 中 , data 为 数据 域 , 用 于 存储 二 又 树 
的 结 点 中 的 数据 ;lchild、rchild 分 别 为 左 、 右 指针 域 , 用 于 指向 表示 其 
左右 孩子 的 结 点 .有 时 ,为 了 便于 寻找 结 点 的 双亲 ,还 可 以 在 结 点 结 
构 中 增加 一 个 指向 其 双亲 结 点 的 指针 域 :parent, 其 结 点 结构 如 图 7- 
10(b) 所 示 。 采 用 这 两 种 结 点 结构 所 构成 的 二 又 树 存储 结构 分 别称 
之 为 二 叉 链 表 和 三 叉 链表 。 例 如 ,图 7-10(c) 所 示 的 二 叉 树 , 其 二 又 链 
表 .三叉 链表 存储 结构 分 别 如 图 7-10(d) 和 图 7-10(e) 所 示 。 


EY 
(a) 二 丸 链 家 结 点 


lchild | data 


(hb) 三 叉 链 表 结 点 


(e) 三 叉 链 表 


图 7-10 ”二叉树 链 式 存储 结构 
在 二 又 树 的 链 式 存 储 结 构 中 ,我 们 需 用 一 个 头 指针 指向 根 结 点 。 
通过 头 指针 ,可 以 获得 其 它 任 一 结 点 的 信息 。 显 然 , 在 二 叉 树 的 二 又 
链表 存储 结构 中 ,存在 一 些 空 指针 域 。 因 为 含有 n 个 结 点 的 二 又 链 
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表 , 总 共有 2n 个 指针 域 (一 个 结 点 有 2 个 指针 域 ); 而 n 个 结 点 只 需 
要 n 一 1 个 分 支 相连 接 , 一 个 分 支 对 应 一 个 指针 , 故 仅 需 n 一 1 个 指 
针 , 所 以 n 个 结 点 的 二 叉 链表 中 有 n 十 1 个 空 指针 域 。 在 后 面 我 们 将 
介绍 可 利用 这 些 空 指针 域 来 存储 其 它 一 些 信息 , 从 而 可 获得 二 叉 树 
的 另 一 种 链 式 存储 结构 。 


7.3 遍历 二 又 树 


遍历 二 又 树 是 指 以 一 定 的 次 序 ,访问 二 叉 树 中 的 每 个 结 点 , 且 每 
个 结 点 只 被 访问 一 次 。 在 这 里 “访问 ”的 含义 很 广 , 可 以 理解 为 输出 结 
点 中 数据 的 值 或 对 结 点 中 的 数据 进行 处 理 等 。 遍 历 二 又 树 的 过 程 实 
际 上 就 是 把 二 . 叉 树 中 的 结 点 进行 线性 排列 。 由 于 二 叉 树 中 有 两 种 分 
支 ,所 以 遍历 的 次 序 不 同 得 到 的 结果 也 就 不 同 。 设 L.D、R 分 别 表示 
遍历 左 子 树 、 访 问 根 结 点 、 遍 历 右 子 树 , 则 对 一 棵 二 叉 树 有 六 种 遍历 
方案 ;DLR.ILDR.LRD、DRL、RDL、RLD。 如 果 在 左 、 右 子 树 的 这 廊 
次 序 上 规定 先 左 后 右 , 则 只 有 前 三 种 遍历 方案 ,分 别称 之 为 : 先 根 
( 序 ) 遍 历 (DLR)、 中 根 ( 序 ) 人 遍历 (LDR), 后 根 ( 序 ) 遍 历 (LRD)。 
在 讨论 : 叉 树 遍历 的 实现 之 前 , 先 给 出 二 叉 链表 结 点 的 PAS- 
CAL 语言 类 型 描述 : 
TYPE bitreptr = ¢ bnode; 
bnode = RECORD 
data :char; 
lchild ,rchild :bitreptr 
END; 
下 面 介 绍 在 二 叉 链 表 上 实现 二 叉 树 遍历 的 算法 。 


一 、 先 根 遍 历 


先 根 遍 历 又 称 为 先 序 遍 历 , 其 递归 定义 是 : 若 二 叉 树 为 空 , 则 空 
操作 ;否则 ,依次 执行 以 下 操作 : 
1. 访问 根 绪 点 ; 
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2. 先 根 遍 历 左 子 树 ; 
3. 先 根 遍 历 右 子 树 。 
此 递归 过 程 算法 的 PASCAL 语言 描述 如 下 : 


PROCEDURE preorder (bt :bitreptr); 全 
BEGIN 
IF bt<>nil THEN 多 © 
BEGIN © & 电 S 
write(bt 4 . data ) ; (b) (+ 
preorder (bt ¢ .lchild); © © 
preorder (bt + .rchild) 
END， 图 7-11 表达 式 
END ; a 一 b/(c 十 d) 十 ex 


例如 ,图 7-11 所 示 的 二 叉 树 表示 下 述 表 的 二 叉 树 表示 


达 式 : 


a—b/(c+d)+exf 


若 先 根 遍历 此 二叉树 , 按 访问 结 点 的 先后 次 序 将 结 点 排列 起 来 ,可 得 
到 二 叉 树 的 先 序 遍 历 序列 ( 先 序 序列 ) 即 表达 式 的 前 级 表示 为 :十 一 


a/b 十 cd x ef 。 


二 、 中 根 遍 历 
中 根 遍 历 又 称 中 序 遍 历 ,其 递归 定义 是 : 若 二 叉 树 为 空 , 则 空 操 、 
作 ; 和 否则 ,依次 执行 以 下 操作 


1. 中 根 遍 历 左 子 树 ; 
2. 访问 根 结 点 ; 
3. 中 根 遍 历 右 子 树 。 
此 递归 过 程 的 PASCAL 语言 描述 如 下 : 
PROCEDURE inorder (bt :bitreptr) ; 
BEGIN 
IF bt<>nil THEN 
BEGIN 
inorder (bt 人 . lehild ) ; 
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write 人 (bt ‘4. data); 
inorder (bt 和 .rchild) 
END 
END; 
对 图 7-11 所 示 的 二 叉 树 ,中 根 遍 历 得 到 的 序列 (中 序 序列 ) 即 表 
达 式 的 中 缀 表示 为 : 
a 一 by/c 十 d 十 ex 
下 面 我 们 讨论 中 根 遍 历 的 非 递归 算法 。 在 非 递 归 的 算法 中 ,需要 
用 栈 保存 遍历 所 经 的 路 径 , 以 便 在 沿 着 结 点 的 左 指针 遇 历 了 它 的 左 
子 树 后 ,能 退 到 该 结 点 、 并 访问 之 。 此 算法 的 框图 如 图 7-12 所 示 。 


初始 化 工作 栈 S 根 结 点 
指针 入 栈 


No 
栈 顶 元 罕 所 指 的 结 点 玉 ,Yes 
为 空 吗 ? 


栈 顶 元 素 所 指 结 点 的 
左 孩 子 结 点 指针 入 栈 


栈 顶 的 空 结 点 出 栈 


工作 栈 S 为 空中 ? 


栈 顶 元 素 出 栈 , 并 由 P 
保存 该 指针 ,访问 P 所 
指 的 结 点 ,把 P 所 指 结 
点 的 右 孩 子 人 栈 


图 7-12 ”中 根 遍 历 的 非 递 归 算 法 框图 
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其 PASCAL 语言 描述 如 下 : 
CONST smax 王 { 栈 的 最 大 容量 ); 
PROCEDER inorder (bt ;bitreptr) ; 
VAR s:ARRAYL1. .smax | OF bitreptr; 
p:bitreptr; 
top:integer; 
BEGIN 
inistack(s); {top:=0)} 
push(s,bt); {top:=top 二 1; sLtop|j:=bt} 
WHILE top>0 DO 
BE(sIN 。 
WHILE sttop]<>nil DO 
BEGIN 
push (s, gettop(s) 和. lchild) {top: =top++1; s[top]:=s 
[top~—114. lchild)} 
END; 
p:=pop(s); {top:=top—1;) 
IF top>0 THEN 
BEGIN 
p:=pop(s); {p:=sLtop]; top:=top—1) 
write(p ‘4 . data); 
push(s,p + .rchild) {top: =top++1;s[Ltop]:=p+.rchild} 


END 
END 
END; 
三 、 后 根 遍 历 


后 根 遍历 又 称 后 序 遍 历 ,其 递归 定义 是 :车 二 叉 树 为 空 , 则 空 操 
作 ; 否 则 ,依次 执行 以 下 操作 : 
1. 后 根 遍历 左 子 树 ; 
2. 后 根 遍 历 右 子 树 ; 
3. 访问 根 结 点 。 
。]17。 


此 递归 过 程 的 PASCAL 语言 描述 如 下 : 
PROCEDURE postorder(bt :bitreptr); 
BEGIN 
IF bt=<>nl THEN 
BEGIN 
postorder (bt ¢ . lchild); 
postorder (bt ‘4 . rchild); 
write(bt 不. data) 
END 
END; 
对 图 7-11 所 示 的 二 叉 树 ,后 根 遍 历 得 到 的 序列 (后 序 序列 ) 即 表达 式 
的 后 缀 表示 为 : 
abcd 十 /一 ef x* 十 
对 二 叉 树 进行 遍历 的 搜索 路 径 除 了 上 述 按 先 序 、 中 序 和 后 序 外 ， 
还 可 以 按 层次 进行 , 即 从 上 到 下 ,从 左 到 右 地 进行 。 
遍历 二 又 树 的 基本 操作 是 访问 结 点 .对 含有 n 个 结 点 的 二 叉 树 ， 
上 述 饥 历 算 法 的 时 间 复 杂 度 均 为 OCn); 所 需 辅助 空间 为 遍历 过 程 中 
栈 的 最 大 容量 即 二 叉 树 的 深度 ,最 坏 情况 下 为 n, 所 以 空间 复杂 度 也 
为 O(n)。 


7.4 线索 二 又 树 


遍历 二 叉 树 的 算法 给 我 们 提供 了 将 二 叉 树 按 一 定 次 序 把 结 点 线 
性 化 的 方法 ,使 每 个 结 点 ( 除 第 一 个 和 最 后 一 个 外 ) 在 这 个 线性 序列 
中 有 且 仅 有 一 个 直接 前 驱 和 直接 后 继 。 例 如, 在 图 7-11 所 示 二 义 树 
结 点 的 中 序 序列 a 一 b/c 十 d 十 e xf 中 ‘c? 的 前 驱 为 </?, 后 继 为 十 ”。 

那么 ,对 于 一 棵 二 叉 树 ,如 何 求 指定 结 点 在 任 一 序列 中 的 前 驱 和 
后 继 呢 ? 方法 有 多 种 。 其 一 就 是 每 一 次 都 遍历 -- 下 二 叉 树 。 当 然 ,这 
就 需要 花费 一定 的 时 间 。 其 二 就 是 通过 一 次 饥 历 ,并 在 遍历 过 程 中 保 
存 这 种 信息 .这 就 需要 在 每 个 结 点 上 增加 两 个 指针 域 , 分 别 用 于 指向 
在 某 一 遍历 方案 中 该 结 点 的 前 驱 和 后 继 。 显 然 ,这 种 方法 降低 了 存储 
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密度 。 男 外 一 种 比较 经 济 实惠 的 方法 ,就 是 下 面 要 介绍 的 线索 二 叉 
树 。 

在 前 面 介绍 的 二 叉 链 表 存 储 结构 中 , 对 有 nn 个 结 点 的 二 叉 树 有 
n 十 1 个 空 指针 域 ,由 此 设想 能 否 利用 这 些 空 指针 域 来 存放 结 点 的 前 
驱 和 后 继 信 息 ,为 了 实现 这 个 设想 ,我 们 对 二 叉 链 表 中 结 点 的 指针 域 
重新 作 如 下 规定 :如 有 果 结 点 有 左 孩 子 , 则 其 lchild 域 指向 其 左 孩子 结 
点 ;否则 令 lchild 域 指 示 其 前 驱 。 若 结 点 有 右 孩 子 , 则 其 rchild 域 指向 
其 右 孩 子 结 点 ;否则 令 rchild 域 指示 其 后 继 。 为 了 标识 结 点 中 两 个 指 
针 域 的 指 癌 ,需要 在 结 点 中 增加 两 个 标志 域 ltag 和 rtag ,其 结构 如 图 


7-13 所 示 。 
图 7-13 线索 树 的 结 点 
其 中 : 
lchild 指向 结 点 的 左 孩 子 结 点 
a a g 
Se lchild 指向 结 点 的 前 驱 结 点 
i E rchild 指向 结 点 的 右 孩 子 结 点 
ttag 一 
1 rchild 指向 结 点 的 后 继 结 点 


以 这 种 结 点 结构 构成 的 二 叉 链 表 作 为 二 叉 树 的 存储 结构 , 称 为 
线索 链表 。 其 中 指向 结 点 前 驱 或 后 继 的 指针 称 为 线索 。 带 有 线索 的 
二 叉 树 称 为 线索 二 叉 树 。 例 如 ,图 7-14(a) 所 示 的 中 序 线索 二 叉 树 ， 
其 对 应 的 中 序 线索 链表 如 图 7-14(b) 所 示 。 图 7-14(c) Cd) 分 别 为 先 
序 线索 二 叉 树 和 后 序 线索 二 叉 树 。 其 中 实 线 为 指针 (指向 左右 孩 
子 ), 虚 线 为 线索 (指向 前 驱 或 后 继 ) 。 


一 、 建 立 线索 二 又 树 


对 二 叉 树 以 某 种 次 序 进行 遍历 并 加 上 线索 的 过 程 称 为 线索 化 。 
那么 ,如 何 进行 二 叉 树 的 线索 化 呢 ? 由 于 线索 化 的 实质 是 将 二 叉 链 
表 结 点 中 的 空 指针 改 为 指向 其 前 驱 或 后 继 结 点 的 线索 ;而 前 驱 和 后 
继 的 信息 只 有 在 遍历 时 才能 得 到 ,所 以 线索 化 的 过 程 即 为 :在 遍历 过 
程 中 修改 指针 的 过 程 ,为 了 记 下 遍历 过 程 中 访问 结 点 的 先后 次 系 , 附 
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(c) 先 序 线索 二 叉 树 《d) 后 序 线索 二 叉 树 


图 7-14 线索 二 叉 树 及 其 存储 结构 
设 一 个 指针 pre, 它 用 于 指向 当前 访问 结 点 的 前 驱 。 图 7-15 描述 了 通 
过 中 序 壳 有 历 建 立 中 序 线索 链表 的 算法 框图 ,其 中 指针 p 指向 当前 访 
问 的 结 点 。 
根据 此 框图 ,我 们 用 PASCAL 语言 描述 此 算法 。 开 始 调 用 时 ， 


pre 为 空 ,p 指向 根 结 点 。 
TYPE thlinktp= 个 thrnode; 
thrnode 王 RECORD 
data :integer ; 
ltag ,rtag :0..1; 
lchild rchild ;thlinktp 
ENPD; 
PROCEDURE inthread (p:thlinktp; VAR pre:thlinktp); 
BEGIN 
IF p< >nil THEN 
BEGIN 
inthread (p .1child, pre); 
IF p¢. lchild=nil THEN 
BEGIN 
pi .ltag 一 1; pf 人 ,lchild: 王 pre 
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END; 
IF pre ‘4 .rchild=nil THEN 


BEGIN 
pre .rtag:=1; pre 4 .rchild:=p 
END:; 
pre:=p; 
inthread (p 和 .rchild, pre) 
END 
END, 


-> 
Yes(p= Nil) 


树 为 空 吗 ? (P:Nil) 


No(pNi1l) 


递归 调用 ,中 序 线索 化 
P 的 左 子 树 


无 
使 P 的 lchild 为 线索 , 指 
向 P 的 前 驱 pre 
pre 有 右 孩 子 吗 ? 
无 

使 pre 的 rchild 为 线索 , 指 
问 Pre 的 后 继 P 
修改 pre, 使 其 指向 刚刚 
访问 的 结 点 P(pre<-p) 


递归 调用 ,中 序 线索 化 
了 的 右 子 树 


图 7-15 ”中 序 线索 化 算法 框图 
对 于 先 序 线索 链表 和 后 序 线索 链表 的 建立 也 可 以 通过 先 序 遍历 
和 后 序 遍历 进行 。 请 读者 自己 完成 。 
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二 、 检索 线索 二 文 树 


在 具有 mn 个 结 点 的 线索 二 叉 树 中 ,只 有 n 十 1 根 线索 (其 余 2n 一 
(n 十 1) 二 n 一 1 个 是 指针 ), 这 还 不 足以 直接 指出 任 一 结 点 的 前 驱 和 
后 继 。 那 么 如 何 来 求 任 一 指定 结 点 的 前 驱 和 后 继 呢 ? 

1. 在 中 序 线索 树 上 求 指定 结 点 的 前 驱 和 后 继 

在 中 序 线 索 树 上 , 求 指定 结 点 p 的 前 驱 , 我 们 可 以 如 下 进行 :如 
果 p 结 点 的 左 标志 域 为 1(Ppf+.iag 王 1)， 则 说 明 p 的 lchild 域 为 线 
索 , 即 pf+.kichild 指向 p 的 前 驱 结 点 。 例 如 ,图 7-14(a) 中 , 结 点 下 的 
tchild 域 指向 其 前 驱 结 点 A。 如 果 p 个 .ltag= 二 0, 则 说 明 p 有 左 孩 子 ,p 
的 前 驱 为 其 左 子 树 上 按 中 序 遍 历 最 后 被 访问 的 结 点 , 即 其 左 子 树 中 
最 右 下 的 结 点 ， 例 如 ,在 图 7-14(a) 中 ,求人 A 的 前 驱 。 首 先 根 据 A 的 
lchild 域 找到 其 左 子 树 的 根 B; 然 后 连续 不 断 地 沿 着 右 链 往 下 寻找 ， 
直至 某 一 个 结 点 的 右 标志 域 为 1, 这 个 结 点 就 是 所 求 的 前 驱 结 点 (在 
图 中 A 结 点 的 前 驱 就 是 C)。 在 中 序 线索 树 上 求 指 定 结 点 Pp 的 前 驱 
的 算法 框图 如 图 7-16(a) 所 示 。 

在 中 序 结 索 树 上 求 指定 结 点 P 的 后 继 , 间 求 p 的 前 驱 类 似 : 如 果 
p 个 .rtag 二 1, 则 p 的 rchild 域 为 线索 , 即 p 个 .rchild 指向 其 后 继 ; 否 
则 (pf+.rtag 王 0)p 有 右 孩 子 ,p 的 后 继 为 其 右 子 树 上 按 中 序 遍 历 最 
先 被 访问 的 结 点 , 即 右 子 树 上 最 左下 的 结 点 。 其 算法 框图 如 图 7-16 
(b) 。 

2. 在 后 序 线索 树 上 求 指定 结 点 的 前 驱 和 后 继 

在 后 序 线索 树 上 求 指定 结 点 Pp 的 前 驱 比 较 简 单 。 如 果 p 有 右 和 孩 
子 ( 即 p 个 .rtag 二 0), 则 p 的 前 驱 就 是 其 右 孩 子 ;否则 ,也 就 是 p 没有 
右 孩 子 , 则 不 管 p 有 无 左 孩 子 ,p 的 lchild 域 指 的 总 是 其 前 驱 。 

在 后 序 线索 树 上 求 指定 结 点 p 的 后 继 比 较 麻烦 。 如 果 p 的 右 标 
志 为 1, 则 Pp 的 rchild 指向 其 后 继 ; 人 否则 需要 先 求 出 p 的 双亲 ( 设 用 ff 
指示 ), 然 后 : 

(1) 车 f 无 右 孩 子 或 p 是 {的 右 孩 子 , 则 p 的 后 继 就 为 其 双亲 {。 

(2) 车 p 为 于 的 左 孩 子 , 并 且 节 另外 有 右 孩 子 q, 则 p 的 后 继 为 f 
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取 q 为 P 的 左 链 ] 取 q 为 p 的 右 链 
(q: =—=p 和. Ichild) (q: =p¢ .rchild) 


(a) 中 序 线索 树 上 求 指 定 结 点 P 的 前 驱 。”(b) 中 序 线索 树 上 求 指定 结 点 了 P 的 后 继 
图 7.16 在 中 序 线索 树 上 求 指定 结 点 p 的 前 驱 和 后 继 
的 右 子 树 上 按 后 序 思 历 最 先 访问 的 结 点 。 这 个 结 点 我 们 可 以 按 下 面 
的 方法 寻找 : 洁 革 的 右 孩 子 q 的 左 链 搜索 ,直至 某 一 个 无 左 孩子 的 结 
点 ;再 看 此 结 点 是 否 有 右 孩 子 , 若 有 , 则 沿 此 右 孩 子 的 左 链 搜索 .如 此 
重复 ,直至 找到 某 一 叶子 结 点 ,此 叶子 结 点 就 是 p 的 后 继 。 可 见 , 在 后 
继 线索 树 上 找 后 继 时 需要 知道 结 点 的 双亲 。 
胃 外 ,在 先 序 线索 树 上 求 指定 结 点 的 后 继 比 较 简单 ,类 似 于 在 后 
序 线索 树 上 求 和 前 驱 。 而 求 指定 结 点 的 前 驱 却 比较 麻烦 ,其 算法 与 在 后 
序 线索 树 上 求 指定 结 点 的 后 继 十 分 类 似 , 这 里 不 再 详 述 。 


、 在 线索 树 上 进行 插入 操作 


一 般 情况 下 ,在 线索 二 叉 树 上 插入 或 删除 一 棵 子 树 ,就 会 破坏 线 
索 。 所 以 ,在 修改 结 点 指向 孩子 结 点 的 指针 时 , 还 必须 修复 线索 。 下 
面 我 们 仅 讨论 在 中 序 线索 上 插入 一 棵 子 树 的 操作 。 设 指针 p 指向 待 
插入 的 中 序 线索 树 的 根 结 点 且 p 结 点 无 右 子 树 ,指针 q 指向 被 插 中 
序 线索 树 bt 中 的 某 一 结 点 。 操 作 addlchild (bt,q,p) 是 将 以 p 为 根 的 
中 序 线索 树 插入 到 中 序 线索 树 bt 中 ,成 为 q 的 左 子 树 ;如 果 q 原来 
有 左 子 树 , 则 在 插入 之 后 成 为 p 的 右 子 树 。 这 个 操作 可 分 二 种 情况 进 
行 。 
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设 指针 s 指向 以 p 为 根 的 中 序 线索 树 中 第 一 个 被 中 序 访问 的 结 
点 ， 

1. 若 q 结 点 原来 没有 左 子 树 , 则 按 中 序 遍 历 规则 ,插入 后 原来 q 
的 前 驱 变 为 s 的 前 驱 , 且 p 的 后 继 为 q。 图 7-17(a) 表示 了 这 种 插入 
操作 前 后 线索 二 又 树 的 情形 。 

2. 若 q 结 点 原来 有 左 子 树 , 设 指针 t 指向 g 的 左 子 树 中 第 一 个 
被 中 序 访问 的 结 点 , 则 插入 后 原来 t 的 前 驱 成 为 s 的 前 驱 ,而 p 成 为 
t 的 前 驱 。 图 7-17(b) 表 示 了 这 种 插入 操作 前 后 线索 二 又 树 的 情形 。 


pre 
2 1 隐 


(a) q 无 左 子 树 (b) q 有 左 子 树 


图 7-17 中 序 线索 树 上 插入 左 子 树 示例 
这 个 操作 的 算法 ,可 由 图 7-18 的 框图 描述 ， 
其 PASCAL 语言 描述 如 下 : 
PROCEDURE addlchild (bt,q,p:thlinktp); 
VAR s,t:thlinktp; 
BEGIN 
SS 一 P; 
WHILE sf+ .ltag 一 0 DO s: 一 sf 人 .lchild; 
IF qf+ .ltag 一 0 THEN 
BEGIN 
t: 一 q 人 个 .lchild; 
WHILE t .ltag 一 0 DO t :一 t+ .lchild; 
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sf+ .lchild;=t ,1child; 
t+ .lchild :一 p; 
p .rtag:=0; p+.rchild: 一 q4 .lchitq; 
q+ .lchild :一 p 
END) 
ELSE BEGIN 
ss 下 .ichild :一 q 个 .lchild; 
b 不. rchild : 一 q; 
d4.ltag: 一 0; q¢4.1child;=p 


END 
END:; 
寻找 以 p 为 根 的 二 


叉 树 的 中 序 序列 
由 5 指示 


寻找 有 左 子 树 中 
按 中 序 遍 历 第 一 个 
被 访问 的 结 点 并 由 索 指向 q 结 点 


) 使 p 成 为 9 的 左 孩 子 


图 7-18 ”中 序 线 索 树 上 插入 左 子 树 的 框图 


QD 使 g 的 前 驱 成 为 S 的 前 驱 
@ 使 p 的 rchild 成 为 后 继 线 
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7.5 二 又 树 与 树 和 森林 之 间 的 转换 


一 、 二 义 树 与 树 之 间 的 转换 


在 这 里 我 们 为 了 不 引起 混淆 ,规定 一 般 树 当 作 有 序 树 来 处 理 。 

1. 一 般 树 转化 为 二 叉 树 

将 一 般 树 转换 成 二 叉 树 可 按 下 列 步骤 进行 操作 ; 

(1) 加 线 : 在 各 相 邻 的 (A) 

兄弟 之 间 加 一 条 
连 线 ， (B) (QO (D) 

(2) 抹 线 :对 每 个 结 (EB) @) (9 
点 ,除了 其 最 左 的 
一 个 孩子 以 外 , 抹 
掉 该 结 点 原先 与 
其 余 孩 子 之 间 的 
连 线 。 

(3) 旋转 :将 图 形 作 适 
当 的 旋转 ,使 之 成 
为 二 义 树 的 树 形 
结构 。 具 体 做 法 (c) 抹 线 (d) 旋转 
是 :新 加 上 去 的 连 
线 均 向 右 下 斜 , 原 图 7-19 一 般 树 转化 为 二 叉 树 的 过 程 
来 的 连 线 均 向 左 斜 。 

图 7-19 展示 了 一 般 树 转化 为 二 叉 树 的 过 程 。 

从 中 我 们 可 以 看 出 "转换 后 的 二 叉 树 根 结 点 没有 右 子 树 ,其 余 结 
点 的 右 孩 子 是 原来 树 中 和 该 结 点 相 邻 的 兄弟 , 结 点 的 左 孩子 是 原来 
树 中 该 结 点 的 最 左 孩 子 。 

2. 二 叉 树 转化 为 一 般 树 

二 叉 树 转化 为 一 般 树 时 ,要 求 二 叉 树 的 根 结 点 没有 右 子 树 ,转化 
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(a) 一 般 树 ”(b〉》 加 线 
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的 具体 步骤 如 下 : 

(1) 加 线 : 对 二 叉 树 中 的 每 一 个 结 点 i, 若 结 点 i 是 其 双亲 的 左 孩 
子 , 则 将 该 结 点 的 右 孩 子 以 及 沿 着 此 右 孩 子 的 右 链 连 续 不 
断 搜索 到 的 所 有 右 孩 子 , 都 分 别 与 结 点 i 的 双亲 用 线 连 起 
来 。 如 图 7-20(b) 所 示 。 

(2) 抹 线 : 抹 掉 原 二 叉 树 中 所 有 双亲 结 点 与 右 孩 子 之 间 的 连 线 。 

《3) 美化 :让 各 结 点 按 层次 排列 ,使 之 成 为 树 形 结构 。 

图 7-20 展示 了 二 叉 树 转化 为 一 般 树 的 过 程 。 


(c) 抹 线 (d) 一 般 树 


”图 7-20 二 叉 树 转化 为 一 般 树 的 过 程 
二 、 二 又 树 与 森林 之 间 的 转化 


1. 和 森林 转化 为 二 叉 树 
森林 是 树 的 有 限 集合 ,所 以 我 们 可 以 按 如 下 方法 把 它 转换 成 二 
叉 树 : 
(1) 首先 将 各 棵 树 分 别 转换 为 二 叉 树 。 
.127 。 


(2) 然后 再 按 森 林 中 树 的 次 序 , 依 次 将 后 一 棵 二 又 树 作为 前 一 
棵 二 叉 树 根 结 点 的 右 子 树 。 这 样 ,第 一 棵 树 的 根 就 是 转化 后 
二 叉 树 的 根 。 : 

图 7-21 为 森林 转化 为 二 叉 树 的 示例 。 
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(a) 森林 
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(b》 各 树 对 应 的 二 叉 树 《c》 转化 后 的 二 叉 树 


图 7-21 森林 转化 为 二 义 树 的 图 示 

2. 二 叉 树 转化 为 森林 

将 一 棵 二 叉 树 转化 成 森林 ,可 按 如 下 步骤 进行 : 

(1) 抹 线 :将 二 叉 树 根 结 点 与 其 右 孩 子 之 间 的 连 线 ,以 及 沿 着 此 
右 孩 子 的 右 链 连续 不 断 搜索 到 的 右 孩 子 间 的 连 线 抹 掉 。 这 
样 就 得 到 了 若干 棵 根 结 点 没有 右 子 树 的 二 叉 树 。 

(2) 将 得 到 的 这 些 二 叉 树 用 前 述 方法 分 别 转化 成 一 般 树 。 


三 、 树 的 遍历 


对 于 树 我 们 可 以 定义 如 下 二 种 次 序 的 遍历 ， 

1. 先 根 ( 先 序 ) 遍 历 树 

先 访 问 树 的 根 结 点 ， 然后 依次 先 根 遍 历 根 的 每 棵 子 树 。 例如 ,对 
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图 7-19(a) 所 示 的 树 , 其 先 根 遍历 所 得 的 先 根 序列 为 :A、B、C、F、H、 
G、D。 

2. 后 根 ( 后 序 ) 遍 历 树 

先 依 次 后 根 遍 历 根 的 每 棵 子 树 ,然后 再 访问 根 结 点 。 例 如 ,对 图 
7-19(a) 所 示 的 树 , 其 后 根 遍 历 所 得 的 后 根 序列 为 :E、B、H、F、C.、PD、 
A。 

从 前 面 树 与 二 叉 树 之 间 的 转换 关系 可 以 得 到 : 树 的 先 根 遍历 和 
后 根 遍 有 历 可 分 别 借助 于 对 应 二 叉 树 的 先 根 遍 历 和 中 根 遍 历 完成 。 


四 、 和 森林 的 遍历 


对 于 森林 我 们 也 可 以 定义 如 下 两 种 遍历 方法 : 

1. 先 序 遍历 森林 

寿 森 林 非 空 , 则 可 按 如 下 步骤 遍历 森林 ， 

(1) 访问 森林 中 第 一 棵 树 的 根 结 点 ; 

(2) 先 序 遍历 第 一 棵 树 中 根 的 子 树 森 林 ; 

(3) 先 序 遍 历 除 第 一 棵 树 以 外 其 余 树 组 成 的 森林 。 

2. 中 序 遍 历 森 林 

若 森 林 非 空 , 则 可 按 如 下 步骤 遍历 森林 : 

(1) 中 序 遍 历 森 林 中 第 一 棵 树 的 根 结 点 的 子 树 森林 ; 

(2) 访问 第 一 棵 树 的 根 结 点 ; 

(3) 中 序 遍 历 除去 第 一 棵 树 之 后 剩余 的 树 构 成 的 森林 。 

例如 ,对 多 7-21(a) 所 示 的 森林 进行 先 序 遍历 和 中 序 遍 历 , 可 得 
到 森林 的 先 序 序列 为 :A、B、C,E、F、G、H,I,J; 中 序 序列 为 :B.C、D、 
A\F.E.HVJ.,I.G., 

从 前 面 森 林 与 二 叉 树 之 间 转 换 关 系 可 知 , 当 森林 转化 为 二 叉 树 
后 ,其 第 一 棵 树 的 根 的 子 树 森林 成 为 二 叉 树 根 的 左 子 树 , 除 第 一 棵 以 
外 的 其 它 树 构成 的 森林 成 为 二 叉 树 根 的 右 子 树 。 所 以 ,森林 的 先 序 遍 
历 和 中 序 遍 历 即 为 其 对 应 二 叉 树 的 先 序 遍历 和 中 序 遍 历 。 
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7.6 哈 夫 曼 树 及 其 应 用 


一 、 基 本 概念 


在 讨论 哈 夫 曼 树 之 前 ,首先 介绍 有 关 树 的 路 径 长 度 概念 ,在 此 完 
义 :从 树 中 一 个 结 点 到 男 一 个 结 点 之 间 的 分 支 构 成 这 两 个 结 点 之 间 
的 路 径 。 路 径 上 分 支 的 数目 称 为 路 径 长 度 。 树 的 路 径 长 度 是 从 根 结 
点 到 所 有 结 点 的 路 径 长 度 之 和 。 例 如 ,图 7-22(a) 所 示 , 含 有 8 个 结 
点 的 二 叉 树 ,其 路 径 长 度 为 14。 显 然 我 们 可 以 看 出 :在 具有 n 个 结 点 
的 二 叉 树 中 ,完全 二 叉 树 具有 最 小 的 路 径 长 度 , 但 是 具有 最 小 路 径 长 
度 的 不 一 定 是 完全 二 叉 树 。 例 如 ,图 7-22(b)、(c) 所 示 的 含有 8 个 结 
点 的 二 棵 不 同 的 二 又 树 ,它们 都 具有 最 小 的 路 径 长 度 , 但 图 7-22(c) 
不 是 完全 二 叉 树 。 


0. (9 个 
(2) 3 © © 2 © 
© of (a) C0 MO) OD ‘As) (ey. i(®) 
从 (8) 
(a) 路径 长 度 为 14 (b) 路 径 长 度 为 13 (c) 路 径 长 度 为 13 


图 7-22 ”二叉树 的 路 径 长 度 

下 面 我 们 将 上 述 概念 进行 推广 ,考虑 带 权 的 情况 。 结 点 的 带 权 路 
径 为 从 树 根 到 该 结 点 的 路 径 长 度 与 结 点 上 权 的 乘积 。 树 的 带 权 路 径 
长 度 为 树 中 所 有 带 权 叶 子 结 点 的 带 权 路 径 长 度 之 和 ,通常 记 为 
WPL。 假设 有 n 个 权 值 为 {Wi,W;,…,W,} ,构造 一 棵 含有 nm 个 叶子 
结 点 的 二 叉 树 ,叶子 的 权 分 别 为 Wi(i 二 1,…,n), 则 其 中 WPL 最 小 
的 二 叉 树 称 为 最 优 二 叉 树 或 哈 夫 曼 树 。 例 如 ,图 7-23 中 的 三 棵 二 又 
树 ,都 有 4 个 叶子 结 点 , 且 它 们 的 权 分别 为 10.7.5.3。 这 三 棵 二 又 树 
的 带 权 路 径 长 度 分 别 为 : 
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(a) WPL 王 10x* 2 十 7x*2 十 5x*2 二 3x2 一 50 
(b) WPL=10x3 十 7x3 十 5x*2 十 3x*1 一 64 
(c) WPL=3x 3 十 5x* 3 十 7 * 2 十 10 * 1 二 48 
其 中 (Cc) 的 WPL 最 小 ,可 以 验证 , 它 是 一 棵 喻 夫 曼 树 。 


图 7-23 ”叶子 带 权 相同 的 三 棵 二 又 树 
显然 , 带 权 路 径 长 度 最 小 的 二 叉 树 不 一 定 是 完全 二 叉 树 ;但 当 
Wi(i 二 1,…,n) 相 等 时 , 完全 二 叉 树 一 定 是 哈 夫 曼 树 。 那 么 ,对 于 给 
定 的 n 个 叶子 结 点 的 权 WiG 二 1,…,n)， 如何 构 造 出 一 棵 险 夫 曼 树 
呢 ? 下 面 我 们 就 讨论 哈 夫 曼 树 的 构造 算法 。 


二 、 哈 夫 曼 算法 


哈 夫 曼 最 早 给 出 了 构造 具有 最 小 带 权 路 径 长 度 的 二 叉 树 的 算 
法 ,俗称 哈 夫 曼 算法 ,其 设计 思想 如 下 所 述 : 
(1) 根 柳 给 定 的 n 个 权 值 {Wi,W,,…,W,) ,构造 一 个 森林 下 ,其 
中 每 棵 二 又 树 Ti 只 有 一 个 权 为 Wi 的 结 扣 。 
(2) 在 中 选取 两 棵 根 结 点 的 权 值 最 小 的 二 叉 树 T; 和 Ti 生成 
一 棵 新 的 二 叉 树 ,其 根 结 点 的 左右 子 树 分 别 为 T;、T;, 且 根 
结 点 的 权 为 其 左右 子 树 根 结 点 的 权 值 之 和 。 
(3) 在 F 中 删除 T;、T;, 并 把 新 生成 的 二 叉 树 加 到 下 中。 
(4) 重复 (2)、(3), 直 到 下 中 只 有 一 棵 二 叉 树 , 它 就 是 哈 夫 曼 树 。 
图 7-24 展示 了 一 棵 险 夫 曼 树 的 构造 过 程 。 
”了 哈 夫 曼 树 在 信息 检索 和 通讯 编码 中 很 有 用 ,下 面 我 们 讨论 这 个 
算法 的 具体 实现 。 
由 于 蛤 厂 曼 树 中 没有 度 为 1 的 结 点 ,所 以 一 棵 具有 n 个 叶子 的 
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7-24 ” 哈 夫 曼 树 的 构造 过 程 
哈 夫 曼 树 共有 2n 一 1 个 结 点 。 我 们 可 以 用 一 个 大 小 为 2n 一 1 的 向 量 
表示 哈 夫 曼 树 ,每 个 分 量 表示 哈 夫 曼 树 中 的 一 个 结 点 , 它 的 结构 如 


下 ; 


其 中 : weight 用 于 存放 结 点 的 权 值 。lch .rch 分 别 用 于 指示 该 结 点 的 
左右 孩子 结 点 在 向 量 中 的 序号 ; 当 ]lch 和 rch 为 0 时 ,表示 该 结 点 为 
叶子 结 点 。parent 用 于 指示 该 结 点 的 双亲 在 向 量 中 的 序号 ; 当 parent 
为 0 时 ,表示 该 结 点 为 一 棵 子 树 的 根 。 图 7-25 为 喻 夫 曼 算法 的 框图 
描述 。 
其 PASCAL 语言 描述 如 下 : 
CONST n= (叶子 数目 的 最 大 值 }; 
Im 一 2xn 一 1; 
TYPE nodetype= RECORD 
weight :integer; 
parent ,lch ,rch :0. . m 
END; 
hufftree 一 ARRAY [1..m | OF nodetype; 
PROCEDURE huffman (w: ARRAY [1..n] OF integer; var ht: 
hufftree); 
VAR 1,.t],t2,wl1,w2,):integer; 
“132。 


BEGIN 
FOR i;=1 TO m DO 
BEGIN 
ht[i]. parent: =0; ht[il]. lch:=0; ht[lil. rch:=0 
END; 
FOR i:=1 TOn DO htfLi]. weight :一 wD]; 
1: 一 0; 
WHILE i<n—1 DO 
BEGIN 
wl:=maxint; w2:=maxint;tl:=0; 
FOR j:=1 TO nn 十 1 DO 
IF ht[j]. parent=0 THEN 
IF ht[j]. weight<wl THEN 
BEGIN 
w2: 一 Wlit2: 一 tl; 
wl:—=ht[i]. weight; tl :一 j 
END 
ELSE IF htLjj. weight<w2 THEN 
BEGIN 
w2:=ht[j]. weight; 
t2 :一 ] 
END:; 
1: 二 1 十 1; 
ht[t1 ]. parent:=n++i; htLt2]. parent :一 n 十 1; 
ht[ntil.lch:=t1; htLntij. rch :一 t2; 
ht[n-ti]. weight :一 w1 十 w2 
END 
END:; 


三 、 哈 夫 受 树 的 应 用 


哈 夫 曼 树 的 应 用 很 广 。 在 不 同 的 应 用 中 ,叶子 的 权 值 可 以 有 不 同 
的 解释 。 当 哈 夫 曼 树 应 用 于 信息 编码 , 则 一 个 叶子 代表 一 个 信息 符 
“1 33。 


组 织 循环 :对 表示 哈 夫 
受 树 的 向 量 ht 赋 初 什 


组 织 循环 :输入 n 个 权 值 ， 
建立 由 n 棵 树 组 成 的 森林 


新 增 结 点 数 赋 初 值 0 


[1..n 十 ij 中 寻找 两 个 权 
值 最 小 的 树 根 结 点 ,用 
t1,t 2 指示 


新 增 结 点 数 i 加 1 ,使 th [bj 
ht[ts] 成 为 th[n 十 i 的 左 、 
右 孩 子 , 并 置 htLn 十 ij 的 权 值 


图 7-25 ”构造 哈 夫 和 曼 树 的 算法 框图 

号 ,其 权 值 就 是 此 符号 出 现在 编码 中 的 频率 ; 当 应 用 于 判定 过 程 , 则 
一 个 叶子 代表 一 类 数据 ,其 权 值 就 是 此 类 数据 出 现 的 频率 。 下 面 我 们 
将 分 别 介绍 。 

1. 哈 夫 曼 树 在 判定 过 程 中 的 应 用 

种 用 哈 夫 曼 树 可 以 构成 最 佳 判 定 过 程 。 判 定 过 程 可 以 用 二 叉 树 
描述 ,从 树 根 开 始 进行 测试 ,测试 的 结果 分 成 二 个 分 支 , 选 其 中 的 一 
个 分 支 再 进行 测试 ,……。 例 如 ,要 对 一 批 正 整数 进行 分 类 :x 过 ==30 
时 属 第 一 类 ,30 二 x 二 =60 时 属 第 二 类 ,60 二 x 二 ==100 时 属 第 三 类 ， 
x 访 100 时 属 第 四 类 。 图 7-26(a) 为 判定 一 个 数 x 属 哪 一 类 的 算法 
框图 。 
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() 判 定 过 程 之 二 


图 7-26 ”了 哈 夫 总 树 在 判定 中 的 应 用 
此 时 ,70% 的 数据 需 进 行 三 次 判别 ,20%% 的 数据 需 进 行 二 次 判 
别 , 只 有 10% 的 数据 需 进 行 一 次 判别 。 如 果 以 10、20、30、40 为 权 构 
造 一 棵 哈 夫 曼 树 ， 则 可 得 图 7-26(b) 所 示 的 判定 过 程 , 它 可 使 40% 
的 数据 只 需 一 次 测试 ,30% 的 数据 只 需 二 次 测试 ,还 有 30% 的 数据 
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需 三 次 测试 。 显 然 ,(b) 要 比 (a) 的 平均 比较 次 数 少 。 

2.、 险 夫 曼 编码 

在 进行 电报 通讯 时 ,需要 将 传递 的 文字 转换 成 由 二 进 制 数 字 组 
成 的 串 。 例 如 ,假设 需 传送 的 电文 为 ‘ABACCDA?’ , 它 只 有 四 种 字符 ， 
所 以 只 需 用 两 位 二 进 制 数 字 便 可 区 分 。 设 A、B、C.D 的 编码 分 别 为 
00、.01.10.11,; 则 上 述 七 个 字符 的 电文 便 为 “00010010101100” 共 14 
位 二 进 制 数字 。 对 方 接 到 后 , 便 可 按 二 位 一 分 进行 译 码 。 

然而 在 传送 电文 时 ,我 们 总 希望 电文 
越 短 越 好 。 如 果 对 每 个 文字 设计 长 度 不 等 
的 编码 , 且 让 在 电文 中 出 现 次 数 较 多 的 文 
字 , 采 用 尽 可 能 短 的 编码 , 则 传送 的 电文 总 
长 便 可 减 小 。 例 如 , 设 A.B、C.、D 的 编码 分 

7-27 ”前 级 码 示例 ” 别 为 0、00、1 和 和 01, 则 上 述 七 个 字符 组 成 的 

电文 便 可 用 长 度 为 9 的 二 进 制 串 

“000011010 表示 。 但是, 这样 的 电文 无 法 正确 翻译 。 例 如 ,传送 的 二 
进 制 串 的 前 四 个 数字 “0000: 就 可 有 多 种 译 法 :或 为 ‘AAAA?” ;或 为 
‘BAA’ ;或 为 '‘BB’ 等。 为 此 ,在 使 用 不 等 长 编码 时 , 任 一 个 字符 的 纺 
码 必 须 不 是 其 他 字符 编码 的 前 级 ,这 种 编码 称 为 前 级 码 .我 们 可 以 利 
用 二 又 树 来 设计 二 进 制 的 前 级 码 。 例如 ,图 7-27 所 示 的 二 又 树 ,其 四 
个 叶子 分 别 表示 A、B、C.D 四 个 字符 。 若 约定 左 分 支 为 二 进 制 数字 
“0， , 右 分 支 为 二 进 制 数 字 和 1? , 则 可 以 把 从 根 结 点 到 叶子 结 点 的 路 径 
上 分 支 数字 组 成 的 二 进 制 串 作为 该 叶子 结 点 所 代表 的 字符 编码 。 显 
然 ,如 此 得 到 的 一 定 是 二 进 制 前 级 码 ,在 图 7-27 中 A、B、C.D 的 前 级 
码 分 别 为 0、10、110、111, 则 上 述 七 个 字符 组 成 的 电文 便 为 
“01001101101110 ,但 它 不 是 最 短 的 。 

现在 的 问题 是 如 何 得 到 电文 总 长 度 最 短 的 二 进 制 前 缀 码 呢 ? 

假设 有 nm 种 字符 Cc1,c;，… ,cs) ,字符 ci 在 电文 中 出 现 的 次 数 为 
W,, 其 编码 长 度 为 Li, 则 由 这 n 种 字符 组 成 的 电文 ,其 二 进 制 编码 串 
的 总 长 度 为 Wix LI 十 W;x* Lz 十 … 十 Wx Ls。。 对 应 于 二 叉 树 , 设 Wi 
为 叶子 字符 的 权 值 , 则 Li 恰 为 从 根 到 该 叶子 的 路 径 长 度 , Wi x* 工 
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十 Ws x* Ls 十 … 十 Wx L, 恰 为 二 叉 树 的 带 
权 路 径 长 度 。 由 此 可 见 ,设计 电 文 总 长 度 最 
短 的 二 进 制 前 缀 码 的 过 程 , 即 为 以 n 种 字 
符 出 现 的 频率 作为 叶子 字符 的 权 , 设 计 一 
棵 哈 夫 曼 树 的 过 程 。 由 此 得 到 的 二 进 制 前 
缀 码 称 为 哈 夫 曼 编 码 。 例 如 : 设 A.B.C.D 图 7-28 了 哈 夫 曼 编 码 
在 电文 中 出 现 的 频率 分 别 为 0.5.0. 1、0. 

35、0.05, 则 按 权 (50,10,35,5} 构 造 的 险 夫 曼 树 如 图 7-28 所 示 。 这 
样 ,A、B、C.D 的 哈 夫 曼 编码 分 别 为 0.101、11 和 100。 


习 是 


1. 设 二 叉 树 结 点 的 先 序 序列 为 A、B、C, 问 有 几 种 不 同 的 二 叉 树 
可 以 得 到 这 一 遍历 结果 ? 并 把 它们 画 出 来 。 

2. 设 一 棵 度 为 m 的 树 中 有 ni 个 度 为 1 的 结 点 , ns 个 度 为 2 的 
结 点 ，…，, na 个 度 为 m 的 结 点 , 问 该 树 中 有 多 少 叶子 结 点 ? 

3. 试 以 二 又 链表 作 存 储 结构 , 编写 算法 将 二 叉 树 中 所 有 结 点 
的 左右 子 树 相 互 交 换 。 

4. 试 以 二 叉 链表 作 存 储 结构 , 编写 将 二 叉 树 按 层 次 顺序 (同一 
层次 自 左 至 右 ) 遍 历 的 算法 。 

5. 试 以 二 叉 链 表 作 存储 结构 ,编写 计算 二 叉 树 中 叶子 结 点 总 
数 的 算法 。 

6. 设 二 叉 树 结 点 的 先 序 序 列 和 中 序 序列 分 别 为 :A,B,C,D,E， 
F,G,H,I 和 B,C,A,E,D,G,H,F,I, 试 画 出 该 二 叉 树 ,并 对 
该 二 又 树 进行 后 序 线索 化 。 

7. 给 定 如 下 一 组 权 值 {4,， 2，3, 5, 7,，8}, 建立 一 棵 哈 夫 曼 树 。 
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第 八 日 图 


图 是 一 种 比 线性 表 和 树 更 为 复杂 的 数据 结构 ,在 线性 表 中 ,每 个 
数据 元 素 最 多 有 一 个 直接 前 驱 和 一 个 直接 后 继 ; 在 树 中 ,数据 元 素 之 
间 有 着 明显 的 层次 关系 ,并 且 每 一 层 上 的 数据 元 素 可 以 和 它 下 一 屋 
中 的 多 个 元 素 相 联 系 , 但 只 能 和 它 上 一 屋 中 的 一 个 元 素 相 联 系 ; 而 在 
图 中 ,任意 两 个 数据 元 素 之 间 都 可 以 有 联系 。 

图 的 应 用 十 分 广泛 ,在 “离散 数学 ”课程 中 有 专门 关于 图 的 理论 
研究 。 在 此 ,我 们 仅 讨 论 应 用 图 论 的 知识 如 何 实现 图 的 操作 ,包括 图 
的 存储 结构 及 其 应 用 。 


8.1 图 的 基本 概念 和 基本 操作 


一 、 图 的 定义 和 术语 


图 是 一 种 数据 结构 , 它 由 两 个 集合 V(G) 和 EC(G) 组 成 , 记 为 G 
二 (V,E)。 其 中 ,V(G) 为 图 G 中 数据 元 素 ( 称 为 顶点 ) 的 非 空 有 限 
集 ;E(G) 是 图 G 中 顶点 之 间 的 关系 的 集合 。 

在 图 G 中 ,如 果 顶 点 之 间 的 关系 是 有 序 对 , 则 称 G 为 有 回 图 。 项 
点 之 间 关 系 的 有 序 对 (x,y) EE、《x,yEV) 称 为 从 顶点 x 到 y 的 一 条 
弧 , 且 x 称 为 弧 尾 、y 称 为 弧 头 。 例 如 ,图 8-1(a) 所 示 为 一 个 有 向 图 
Gi, 其 中 : 

V(G)={1,2,3};E(G)={(1,2),(2,1),(2,3)} 

在 这 里 (1,2) 和 (2,1) 是 两 条 不 同 的 弧 。 / 

在 图 G 中 ,如 果 顶 点 之 间 的 关系 是 无 序 对 , 则 称 G 为 无 向 图 。 顶 
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点 之 间 关 系 的 无 序 对 (x,y) EE、(x,yEV) 称 为 x 和 y 之 间 的 一 条 
边 。 例 如 ,图 3-1(b) 所 示 图 Gs 是 无 向 图 。 其 中 :; 

V(G,)= .1,2,3,4); 

EE(G= (lo (L333) CLy4)s(253) 5 (2,4)3 (C354)) 


0 
Os=Ons® 0 二 
~ 
(a) 有 向 图 Gi (b) 无 向 图 Gs 


图 8-1 图 的 示例 

在 下 面 的 讨论 中 ,我 们 不 考虑 顶点 到 其 自身 的 弧 或 边 , 即 如 果 弧 
《ViyVj) EE(G) 或 边 (viyvj) EE(G) 时 ,i 关 ]。 在 这 里 ,我 们 用 n 表示 图 
中 顶点 的 数目 ,用 e 表示 弧 或 边 的 数目 。 那 么 对 于 无 向 图 ,e 的 取 值 
范围 从 0 到 n(n 一 1)/2, 并 且 称 具有 nn 一 1)/2 条 边 的 无 向 图 为 完 
全 图 ;对 于 有 问 图 ,e 的 取 值 范围 人 0 到 n(n 一 1), 并 且 称 具有 n(n 一 
1) 条 边 的 有 疝 图 为 有 问 完全 图 。 当 图 中 的 边 或 弧 很 少 ( 如 e<nlogn) 
时 , 则 称 其 为 稀疏 图 ,反之 称 为 稠密 图 。 

有 时 图 的 边 或 弧 具 有 与 之 相关 的 数 称 为 权 , 这 些 权 可 以 表示 从 
一 个 顶点 到 另 一 个 顶点 的 距离 或 时 间 等 .这 时 ,我 们 称 这 种 带 权 的 图 
为 网 。 

设 有 两 个 图 G=(V,E) 和 G = 二 (V',E'), 如 果 V'CYVY 有 ECE， 
则 称 G 为 G 的 子 图 。 例 如 ,图 8-2(a) 是 图 8-1(a) 的 一 些 子 图 ,图 8-2 
(b) 是 图 8-1(b) 的 一 些 子 图 。 

对 于 无 向 图 G 二 (V,E) ,如 果 边 (vi,v) EE, 则 称 顶 点 vi 和 vi 互 
为 邻接 点 , 即 v; 和 v; 相 邻 接 ; 称 边 (vi,vj) 依 附 于 顶点 v; 和 vj, 或 者 说 
边 (vi,Vi) 与 顶点 vi、v; 相关 联 ; 称 与 顶点 v 相关 联 的 边 的 数目 为 v 的 
度 , 记 为 TD(v)。 例 如 ,Gs 中 顶点 vs 的 度 为 3。 对 于 有 向 图 G=(V， 
下 ), 如 果 弧 (vi,vi)EEE, 则 称 顶 点 vi 邻接 到 顶点 vj;, 顶 点 vi 邻接 自 顶 
点 vi; 称 弧 (viyvi? 与 顶点 vi\vi 相关 联 。 以 顶点 v 为 头 的 弧 的 数目 称 为 
v 的 人 度 , 记 为 ID(Cv); 以 顶点 v 为 尾 的 弧 的 数 且 称 为 v 的 出 度 , 记 为 
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(a) G1 的 子 图 
(b) ee 


图 8-2 子 图 的 示例 
OD(Cv) ;顶点 v 的 度 TDCv) 二 IDCv) 十 OD(Cv)。 例如 ,Gi 中 顶点 va 的 
出 度 为 2, 入 度 为 1, 度 为 3, 一 般 地 , 若 图 G 有 nn 个 顶点 ,e 条 边 或 弧 ， 
则 有 : 
e 二 (TDCv1) 十 TDCv;y) 十 … 十 TD(v,))/2 

在 无 向 图 G==(V,E) 中 ,从 顶点 vp 到 顶点 w 的 一 条 路 径 是 一 
顶点 序列 (wy,va，vz，…vnyvo) 且 (veyva)、(Cviayvz)、 (vinyva) 是 下 
(G) 中 的 边 ,路径 上 边 的 数目 称 为 该 路 径 的 长 度 。 例 如 ,在 图 8-1(b) 
的 G; 中 ,从 顶点 vi 到 vs 可 以 通过 边 (vi,via),(viyvz)，, (vvs) 而 到 
达 , 其 路 径 为 (vi,viyvzyvs), 路 径 长 度 为 3。 

对 于 有 向 图 ,路 径 由 弧 组 成 因而 是 有 向 的 。 例 如 ,在 图 8-1(a) 
的 Gi 中 ,从 Vi 到 V3 的 路 径 可 通过 弧 (viyvz),(vzyvs) 而 到 达 , 其 路 径 
可 记 为 (vi,va,vs》, 路 径 长 度 为 2。 

在 一 条 路 径 中 ,顶点 不 重复 出 现 的 路 径 称 为 简单 路 径 ; 第 一 个 顶 
点 和 最 后 一 个 顶点 相同 的 路 径 称 为 回路 或 环 ; 除 第 一 个 顶点 和 最 后 
一 个 顶点 外 ,其 余 顶 点 都 不 相同 的 回路 称 为 简单 回路 。 

在 无 向 图 中 ,车 从 vi 到 v; 有 路 径 存 在 , 则 称 v 和 vi 是 连通 的 。 如 
果 在 图 G 中 , 任何 两 个 顶点 都 是 连通 的 , 则 称 G 为 连通 图 。 无 向 图 
中 的 极 大 连通 子 图 称 为 它 的 连通 分 量 。 例 如 ,图 8-1 中 的 G: 为 连通 
图 ;图 8-3(a) 中 的 G; 不 是 连通 图 , 它 的 三 个 连通 分 量 如 图 8-3(b) 所 
不 : 

在 有 向 图 G 中 ,如 果 对 于 一 对 顶点 vviEV 且 vivi 从 到 vi 
和 v 到 vi 都 存在 路 径 , 则 称 w 和 vi 是 强 连 通 的 。 如 果 在 图 G 中 , 任 
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(a) 无 向 图 G3 (b) Gs 的 三 个 连通 分 量 


图 8-3 无 向 图 及 其 连通 分 量 
何 两 个 顶点 都 是 强 连通 的 , 则 称 G 是 强 @- 一 @® 。 @ 
连通 图 。 有 向 图 中 的 极 大 强 连 通 子 图 称 ， 。， C 的 强 连 通 分 量 
为 它 的 强 连通 分 量 。 例 如 ,图 8-1(a) 中 的 
G, 不 是 强 连通 图 , 它 有 二 个 强 连通 分 量 , 如 图 8-4 所 示 : 

-个 连通 图 的 生成 树 是 该 连通 图 的 一 个 极 小 个 
连通 子 图 , 它 含有 图 中 全 部 n 个 顶点 ,但 是 只 有 足 可 9 
以 构成 一 棵 树 的 n 一 1 条 边 。 例 如 ,图 8-5 是 G; 的 一 (4) 

棵 生成 树 。 如 果 在 一 棵 生成 树 上 添加 一 条 边 , 则 必 
定 构成 一 个 环 , 因 为 这 条 边 使 得 它 所 依附 的 那 两 个 
顶点 之 间 有 了 第 二 条 路 径 。 


二 、 图 的 基本 操作 


图 8-5 G; 的 
生成 树 


], 顶点 定位 函数 (loc-vextex(G,v)) :确定 顶 扣 
v 在 图 G 中 的 位 置 。 大 图 中 无 此 顶点 , 则 函数 值 为 零 。 

2， 取 顶点 函数 (get-vextex(G,iD)) : 求 图 CG 中 第 1 个 顶点 。 若 1 大 
于 图 G 中 的 顶点 数 , 则 函数 值 为 空 。 

3. 求 第 - -个 邻接 点 函数 (first-adj(G,v)): 求 图 G 中 顶点 v 的 第 
一 个 邻接 点 。 若 v 没有 邻接 点 或 图 G 中 无 顶点 v, 则 函数 值 
为 “ 空 ”。 

4. 求 下 一 个 邻接 点 函数 (next-adj(G,v,w)): 已 知 w 为 图 G 中 
顶点 v 的 一 个 邻接 点 , 求 顶点 v 的 w 以 下 一 个 邻接 点 ,者 w 
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是 v 的 最 后 一 个 邻接 点 , 则 函数 值 为 “ 空 ”。 
5, 插入 顶点 (ins-vextex(G,v)): 在 图 G 中 增加 一 个 顶点 v, 使 
之 成 为 图 G 的 第 n 十 1 个 顶点 ,其 中 m 为 插入 之 前 图 G 中 的 


顶点 数 。 

6. 删除 顶点 (deLvextex(G,v)) :在 图 G 中 删除 顶点 v 以 及 所 有 
与 顶点 v 相关 联 的 弧 。 

7. 插入 弧 (ins-arc(G,v,w)): 在 图 G 中 增加 一 条 从 顶点 v 到 w 
的 弧 。 

8. 删除 弧 (del-arc(CG,v,w)) :在 图 G 中 删除 一 条 从 顶点 v 到 w 
的 弧 。 


8.2 图 的 存储 结构 


图 的 结构 比较 复杂 ,应 用 也 很 广泛 ,所 以 图 的 存储 结构 也 比较 
多 。 对 图 的 存储 结构 的 选择 取决 于 具体 应 用 所 需 进 行 的 操作 。 下 面 
介绍 四 种 最 常用 的 存储 结构 :邻接 矩阵 .邻接 表 .十 字 链 表 和 邻接 多 
重 表 。 


一 、 邻 接 矩 阵 


如 果 图 中 项 扣 除 了 编号 外 别 无 其 它 信 息 , 则 可 采用 邻接 矩阵 存 
储 结构 。 图 的 邻接 矩阵 存储 结构 是 用 一 个 二 维 数 组 来 表示 图 中 顶点 
以 及 顶点 间 的 相 邻 关系 。 设 图 G 中 有 n> 王 1 个 顶点 , 则 G 的 邻接 矩 
阵 是 按 如 下 定义 的 一 个 n 阶 方 阵 A: 

se 1 , 若 《ViyVj) 或 (vi,vi) EE(G) 

ALjJ= [0 > 
例如 ,图 8-1 中 的 G1,G; 的 邻接 矩阵 分 别 表 示 为 A 和 A, 矩阵 中 的 
行 、 列 号 对 应 于 图 中 顶点 的 编号 。 


0 0 1 
1 A,= ] 
1 


1 
一 |1 0 
0 0 


0 


[| 
OO 上 
OO pm 一 天 4 
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显然 ,无 回 图 的 邻接 惩 阵 是 对 称 的 , 故 对 具有 nm 个 顶点 的 无 向 
图 ， 只 需 存放 它 的 下 (或 上 ) 三 角 和 矩阵 , 仅 占 nCn 十 1)/2 个 单位 的 存 
储 空 间 ; 用 邻接 矩阵 来 表示 一 个 具有 n 个 顶点 的 有 向 图 时 则 和 需要 nn 
个 单位 的 存储 空间 。 

在 图 的 邻接 矩阵 上 ,很 容易 判定 图 中 任意 两 个 顶点 之 间 是 否 相 
邻接 ,也 很 容易 求 各 个 顶点 的 度数 。 对 于 无 向 图 ,邻接 和 矩阵 第 i 行 元 
素 之 和 就 是 图 中 第 i 个 顶点 的 度数 ;对 于 有 向 图 ,邻接 矩阵 第 i 行 元 
素 之 和 为 项 点 i 的 出 度 , 第 i 列 元 素 之 和 为 项 点 i 的 人 度 。 


二 、 邻 接 表 


邻接 表 是 图 的 一 种 链 式 存储 结构 。 在 邻接 表 中 ,为 图 中 每 个 顶点 
建立 一 个 单 链表 ,第 i 个 单 链表 中 的 结 点 表示 依附 于 顶点 vi 的 边 ( 对 
有 向 图 表示 以 顶点 vi 为 尾 的 弧 )。 链 表 中 的 每 个 结 点 由 二 个 域 组 成 ， 
如 图 8-6(a) 所 示 。 其 中 ,邻接 点 域 (adjvex) 指 示 与 顶点 vi 邻接 的 顶点 
在 图 中 的 位 置 , 链 域 (nextare) 用 于 指示 另 一 条 依附 于 vi 的 边 或 另 一 
条 以 vi 为 尾 的 弧 。 每 个 链表 附设 一 个 表 头 结 点 , 表 头 结 点 由 二 个 域 
组 成 ,如 图 8-6(b) 所 示 。 其 中 ,数据 域 (vexdata) 用 于 存储 顶点 的 名 或 
有 关 顶 点 的 其 它 信息 , 链 域 (firarc) 用 于 指向 链表 中 的 第 一 个 结 点 ; 
并 且 这 些 表 头 结 点 可 以 用 一 个 向 量 存储 ,以 便 能 随机 访问 任 一 个 项 
点 的 链表 。 例 如 ,图 8-6(Cc) 和 (d) 所 示 分 别 为 图 8-1 中 图 G, 和 图 G， 
的 邻接 表 。 

一 个 含有 nm 个 项 点,e 条 边 的 无 向 图 ,其 邻接 表 需 n 个 头 结 点 和 
2e 个 表 结 点 。 显 然 , 在 边 较 少时 ,用 邻接 表 表 示 图 比邻 接 抢 阵 节 省 空 
间 。 在 无 向 图 的 邻接 表 中 ,顶点 vi 的 度 恰 为 第 i 个 链表 中 结 点 的 数 
目 。 在 有 问 图 的 邻接 表 中 ,第 i 个 链表 中 的 结 点 数目 为 顶点 vi 的 出 
度 ; 为 了 求人 度 ,必须 遍历 整个 邻接 表 , 在 所 有 弧 结 点 中 邻接 点 域 的 
值 为 i 的 弧 结 点 的 个 数 即 为 wi 的 人 度 。 当 然 , 有 时 为 了 便于 确定 顶点 
的 和 人 度 或 以 顶点 vi 为 头 的 弧 , 可 以 建立 一 个 有 向 图 的 道 邻接 表 ， 即 
对 每 个 顶点 vi 建立 一 个 以 vi 为 弧 头 的 弧 结 点 的 链表 。 例 如 ,图 8-6 
(e) 所 示 为 有 向 图 Gi 的 逆 邻 接 表 。 
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adjvcx | nextarc 


(a) 表 结 点 
(b) 头 结 点 (c) G1 邻接 表 
Li 
证 轨 区 > 
这 外 
(d) G, 的 邻接 表 (e) G1 的 道 邻 接 表 


图 8-6 图 的 邻接 表 
在 邻接 表 上 容易 找到 任 一 顶点 的 第 一 个 邻接 顶点 和 下 一 个 邻接 
顶点 ,但 要 判定 任意 两 个 顶点 vi 和 vj 之 间 是 否 有 边 或 弧 相 连 , 则 需 
搜索 第 1 个 或 (和 ) 第 个 链表 ,因此 ,不 及 邻接 矩阵 方便 。 


三 、 十 字 链 表 


十 字 链 表 是 有 向 图 的 另 一 种 链 式 存储 结构 。 可 以 将 它 看 成 是 由 
有 向 图 的 邻接 表 和 道 邻接 表 合 起 来 的 一 种 链表 。 在 十 字 链 表 中 ,有 向 
图 中 的 每 一 条 弧 对 应 有 一 个 结 点 表示 , 称 为 弧 结 点 ;图 中 的 每 一 个 顶 
点 对 应 也 有 一 个 结 点 表示 , 称 为 顶点 结 点 。 这 些 结 点 的 结构 如 图 8-7 
(a)、(b) 所 示 。 在 弧 结 点 中 有 四 个 域 :其 中 , 尾 域 (tailvex) 和 头 域 
(headvex) 分 别 表示 绝 尾 和 弧 头 两 个 顶点 在 图 中 的 编号 ; 链 域 hlink 
指向 具有 相同 弧 头 的 下 一 个 弧 结 点 , 链 域 tink 指向 具有 相同 弧 尾 的 
下 一 个 弧 结 点 。 这样, 弧 头 相同 的 弧 结 点 通过 hlink 域 链 在 同一 链表 
上 ; 弧 尾 相同 的 弧 结 点 通过 tlink 域 也 链 在 同一 链表 上 。 顶 点 结 点 由 
三 个 域 组 成 :其 中 数据 域 data 用 于 存放 顶点 有 关 的 信息 , 链 域 firstin 
和 firstout 分 别 指向 以 该 顶点 为 弧 头 或 弧 尾 的 第 一 条 弧 的 结 点 ; 同 
时 ,我 们 把 所 有 的 顶点 结 点 用 一 个 向 量 存放 。 例 如 ,图 8-7(c) 为 图 
8-1(a) 所 示 的 有 向 图 G, 的 十 字 链 表 存 储 结构 。 

在 有 向 图 的 十 字 链 表 上 ,对 任 一 顶点 w 求 以 其 为 弧 尾 的 弧 和 求 
以 其 为 弧 头 的 弧 是 同样 方便 的 。 
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(a) 弧 结 点 
firstin| firstout 
4D》 顶点 结 点 (c) Gi 的 十 字 链 下 
图 8-7 有 向 图 的 十 字 链 表 
四 、 邻 接 多 重 表 


邻接 多 重 表 是 无 向 图 的 另 一 种 链 式 存 储 结构 。 

虽然 邻接 表 是 无 向 图 的 一 种 很 有 效 的 存储 结构 ,然而 由 于 图 中 
的 每 一 条 边 Cvi,vi) 在 邻接 表 都 有 两 个 结 点 表示 :一 个 结 点 在 w 的 链 
表 中 ,一 个 结 点 在 vi 的 链表 中 ,这 给 图 的 某 些 操作 带 来 了 一 些 不 便 ， 
例如 ,要 修改 一 条 边 的 有 关 信 息 或 删除 一 条 边 等 ,都 必须 同时 对 这 条 
边 的 两 个 结 点 进行 操作 。 此 时 ,用 邻接 多 重 表 存 储 无 向 图 会 更 适宜 ， 

在 无 向 图 的 邻接 多 重 表 中 ,每 一 条 边 用 一 个 结 点 表示 , 称 为 边 结 
点 ,其 结构 如 图 8-8(a) 所 示 。 其 中 ivex ,jvex 分 别 表示 该 边 依 附 的 两 
个 顶点 在 图 中 的 编号 ; 链 域 让 nk 和 jlink 分 别 用 于 指向 依附 于 顶点 
ivex 和 jvex 的 下 一 条 边 的 结 点 。 图 中 的 每 一 个 顶点 也 用 一 个 结 点 表 
不 , 称 为 项 点 结 点 ,其 结构 如 图 8-8(b) 所 示 。 其 中 数据 域 data 用 于 存 
储 有 关 该 顶点 的 信息 , 链 域 firstedge 指向 第 一 条 依附 于 该 顶点 的 边 
的 结 上 入。 这 些 顶 点 结 点 可 以 用 一 个 向 量 存储 。 例如 ,图 8-8(c) 所 示 为 
图 8-1(b) 中 G; 的 邻接 多 重 表 。 


ED ny 
(a) 边 结 点 


-en hrm gee 
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| data] firstedge] 4 | ~ 


(b) 顶点 结 点 (c) Gz 的 邻接 多 重 表 


图 8-8 无 向 图 的 邻接 多 重 表 
显然 ,在 邻接 多 重 表 中 依附 于 同一 顶点 w 的 边 通过 链 域 ilink 链 


接 在 同一 链表 中 ;由 于 每 条 边 依附 于 二 个 顶点 , 故 每 个 边 结 点 同时 处 
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在 两 个 链表 中 。 
8.3 ”图 的 遍历 和 连通 分 量 


从 图 中 某 -顶点 出 发 访问 图 中 所 有 顶点 ,和 且 使 每 一 个 项 点 仅 被 
访问 一 次 ,这 一 过 程 就 叫做 图 的 遍历 。 图 的 遍历 类 似 于 树 的 遍历 ,但 
要 复杂 得 多 .因为 图 中 的 一 个 顶点 可 能 和 其 余 任 何 顶 点 相 邻 接 , 所 以 
在 访问 了 某 个 项 点 之 后 , 沿 着 某 条 路 径 搜索 ,可 能 又 会 回 到 该 项 操 
上 。 例 如 ,图 8-1(b) 中 的 Gz, 由 于 图 中 存在 回路 ,所 以 当 从 vi 出 发 ， 
在 访问 了 vv: 之 后 , 沿 着 边 (v2,Vvi) 又 回 到 了 vi。 为 此 ,在 遍历 图 时 
必须 对 已 被 访问 过 的 顶点 进行 标志 ,以 免 重复 访问 。 

通常 有 两 种 遍历 图 的 方法 :一 种 称 为 深度 优先 搜索 方法 , 另 一 种 
称 为 广度 优先 搜索 方法 。 


一 、 深 度 优先 搜索 法 


深度 优先 搜索 类 似 于 树 的 先 根 遍历 ,其 做 法 如 下 :从 图 中 某 一 个 
顶点 vo 出 发 ， 
(1) 访 问 此 顶点 ; 
(2) 从 vo 的 一 个 未 被 访问 过 的 邻接 顶点 出 发 ,深度 优先 搜索 图 。 
显然 ,这 是 一 个 递归 过 程 。 下 面 我 们 以 邻接 表 作 为 图 的 存储 结 
构 ,具体 讨论 深度 优先 搜索 算法 。 在 此 我 们 设 一 个 辅助 数组 visited 
[1. .nj 用 于 标识 一 个 顶点 是 否 被 访问 过 。 初始 时 ,其 每 个 分 量 visited 
[i]] 都 为 假 (false) ,表示 顶点 vi 还 没有 被 访问 ;一 旦 vi 被 访问 , 则 vis- 
ited[ 门 置 为 真 (true)。 图 8-9 为 深度 优先 搜索 算法 的 框图 描述 。 
下 面 我 们 用 PASCAL 语言 描述 此 算法 。 在 这 里 ,假设 对 visited 
的 初始 化 已 在 主 程序 中 完成 。 
CONST 
nmax 一 {图 中 顶点 的 最 大 数目 };; 
TYPE 
arcptr 一 个 arcnodej 
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arcnode = RECORD 
adjvex :integer; 
nextarc :arcptr 
END; 
vnode=RECORD 
vexdata :char; {顶点 的 名 ) 
firstarc :arcptr 
END; 
adjiist 一 ARRAY [1..nmax | OF vnode; 
PROCLEDURE dfs( g:adjlist; v:integer; VAR visited:ARRAY 
[1..nmax | of boolean); 
VA p:arcptr; 
BEGIN 
wiite (g[vj. vexdata); { 访 问 v) 
visited[v |; =true; 
p: 一 g[vj.firstarc; 
WHILE p= >nil DO 
BEGIN 
IF NOT visited[p 个 .adjvex | 
THEN dfs(g,p .adjvex ,visited); 
p:=p 个 .nextarc 
END 
END; 
设 图 G 有 n 个 顶点 ,e 条 边 ,由 于 在 搜索 过 程 中 每 条 边 的 结 点 都 
要 被 检测 一 次 ,而 边 结 点 有 2e 个 ,所 以 完成 搜索 的 时 间 复 杂 度 可 记 
为 O(e)。 
对 于 如 图 8-10(a) 所 示 的 无 向 图 ,其 邻接 表 如 图 8-10(b) 所 示 ， 
则 按 上 述 算法 ,其 深度 优先 搜索 所 访问 的 顶点 序列 为 A、B、D、H.、E、 
| i DE 


二 、 广度 优先 搜索 


广度 优先 搜索 类 似 于 树 的 按 层次 遍历 ,其 做 法 如 下 :从 图 中 某 一 
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从 顶点 Vo 开始 搜索 : 
间 

时 Visitea[V 为 true 

建立 搜索 指针 了 ,使 


其 指向 依附 于 Vo 的 
第 一 条 边 结 点 


间 V0 相 邻接 的 顶点 没有 (P= Nil) 
还 有 吗 ? (P= 二 Nil)? 


有 (PNil) 
结 
P 所 指 的 边 中 , 同 Vo 相 访问 过 (结束 ) 
接 的 顶点 V 被 访问 过 吗 ? 


修改 P, 使 其 指向 下 一 
条 附 于 Vo 的 边 


图 8-9 深度 优先 搜索 算法 的 框图 


(a) 无 向 图 G (b) G 的 邻接 表 


图 8-10 无 向 图 G 及 邻接 表 
顶点 vi 出发， 
(1) 首 先 访问 vi, 然后 依次 访问 和 vi 相 邻 接 的 顶点 va vizg、… va 
《2) 再 按 Vii、vis、…、vx 的 顺序 ,访问 其 中 每 个 顶点 的 ,所 有 未 被 


访问 过 的 邻接 顶点 。 如 此 反复 ,直到 图 中 所 有 与 vi 相连 通 的 顶点 都 
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被 访问 到 。 例 如 ， 对 于 图 8-10(a) 所 示 的 图 G, 按 广度 优先 搜索 方法 ， 
从 A 出 发 的 顶点 访问 序列 为 A、BC.D、E、.F、.G、H。 

为 了 实现 此 算法 ,我们 需要 设置 一 个 队列 。 一 开始 把 mw 入 队 , 然 
后 从 队列 中 取 顶 点 访问 ;访问 完 后 ,把 同 该 顶点 相 邻 接 的 未 被 访问 过 
的 顶点 入 队 ,然后 再 从 队列 中 取 顶 点 访问 ;…。 如 此 重复 ,直到 队列 为 
空 。 图 8-11 为 该 算法 的 框图 描述 。 


初始 化 队列 并 使 Vi 入 队 
从 队列 中 取出 一 个 顶点 V 


| 


建立 搜索 指针 P, 使 其 
指向 第 -条 依附 于 V 的 边 


同 V 相 邻接 的 顶点 还 有 \、 No(P==Nil) 


吗 ? (PxNil)? 
Yes(P¥Nil) 
P 所 指 的 边 中 ,与 V 相 邻接 Yes 
的 顶点 ,U 是 否 已 被 访问 过 ? - 同 Vi 相 连通 的 顶点 
Ne a 
(队列 O 空 ) 
已 都 被 访问 过 (队列 空 ) 
结束 
修改 P, 使 其 指 问 下 电工 晤 
一 条 依附 于 V 的 边 


图 8-11 广度 优先 搜索 算法 的 框图 
该 算法 的 PASCAL 语言 描述 ,请 读者 根据 图 8-11 所 示 框 图 自 
已 完成 。 该 算法 的 时 间 复 杂 度 也 是 D(e)。 
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三 、 图 的 连通 分 量 


在 对 无 向 图 进行 遍历 时 ， 
对 于 连通 图 只 需 一 次 调用 搜索 
过 程 (深度 或 广度 搜索 )。 也 就 
是 说 ,从 图 中 任 一 顶点 出 发 便 
可 访问 到 图 中 各 个 顶点 。 然 而 ， 
对 于 非 连通 图 ,从 图 中 一 个 项 
点 v 出 发 ,只 能 访问 到 v 所 在 
的 连通 分 量 。 显 然 , 若 从 无 向 图 
的 每 个 连通 分 量 中 的 一 个 顶点 
出 发 搜索 图 ,就 可 以 求 出 无 向 
图 的 所 有 连通 分 量 。 对 具有 nn 


设立 顶点 计数 器 1(C1: 一 1) 
顶点 Vi 被 访问 过 吗 ? > 已 征 访 癌 


没有 被 访问 


调用 图 的 搜索 (广度 或 
深度 ) 过 程 , 求 Y ;所 在 
的 连通 分 量 


修改 i, 以 便 检测 下 一 
个 顶点 (li: 二 1 十 1) 


图 中 所 有 顶点 都 


lI>n 


个 项 点 的 无 向 图 ,图 8-12 是 求 
其 连通 分 量 算法 的 框图 描述 。 
求 无 向 图 连通 分 量 的 算法 框图 
8.4 最 小 生成 树 


前 面 ,我 们 介绍 了 生成 树 的 概念 。 显 然 , 一 个 连通 图 的 生成 树 不 
一 定 是 唯一 的 ,例如 ,对 图 8-10Ca) 所 示 的 无 向 图 G, 当 分 别 按 深度 和 
广度 优先 搜索 法 进行 遍历 时 就 可 以 得 到 图 8-13(a)、Cb) 所 示 的 两 棵 
不 同 的 生成 树 ,并 分 别称 为 深度 优先 生成 树 和 广度 优先 生成 树 。 

利用 生成 树 可 以 解决 一 些 实际 工程 问题 ,例如 ,要 在 n 个 城市 之 
间 建立 通讯 联络 网 ,而 连通 n 个 城市 至 少 需要 n 一 1 条 通讯 线路 。 若 
把 城市 看 成 图 的 顶点 ,通讯 线路 看 成 边 , 则 该 图 的 任 一 生成 树 就 是 一 
个 可 行 的 建造 通讯 网 的 方案 .由 于 n 个 城市 之 间 , 可 行 线路 有 n(n 一 
1)/2 条 ,那么 ,如 何 选择 建造 代价 最 小 的 .连通 n 个 城市 的 n 一 1 条 
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(a) 深 度 优先 生成 树 《b) 广 度 优先 生成 树 


图 8-13 图 G 的 两 棵 生成 树 
线路 呢 ? 这 就 是 我 们 接 下 来 要 讨论 的 构造 最 小 生成 树 的 问题 . 

我 们 把 边 上 赋 以 权 值 的 图 称 为 网 或 带 权 图 。 所 谓 最 小 生成 树 就 
是 该 生成 树 中 所 有 边 上 的 权 值 之 和 达到 最 小 。 构 造 最 小 生成 树 的 算 
法 很 多 ,它们 -- 般 都 是 按 如 下 的 原则 进行 ; 尽 可 能 的 选取 权 值 小 的 
边 ,但 不 能 构成 回路 ;直到 在 网 中 选择 了 n 一 1 条 边 以 连通 网 的 n 个 
顶点。 下 面 我 们 介绍 两 个 典型 的 构造 最 小 生成 树 的 算法 : 普 里 姆 ， 
(Prim) 算 法 和 克 和 鲁 斯 卡尔 (Kruskal) 算 法 。 


一 、 普 里 姆 算法 


设 N= 二 (V,E) 是 连通 网 ,TE 是 N 上 最 小 生成 树 中 边 的 集合 ,U 
是 V 的 一 个 非 空子 集 。 任 选 一 个 顶点 uo, 算 法 从 U= {uo)(CuoEV)， 
IE 一下 开始 ,重复 执行 下 述 操作 : 在 所 有 uEU,v EV 一 U 的 边 (u， 
v) 中 找到 一 条 代价 最 小 的 边 (u ,v 7) 并 人 集合 TE, 则 时 把 并 和 人 U， 
直到 U=V, 或 TE 中 有 n 一 1 条 边 为 止 , 则 所 得 的 T=(V,TE) 为 NN 
上 的 最 小 生成 树 。 | 

为 了 实现 这 个 算法 需 附 设 一 个 辅助 数组 closedge[1. .nj, 对 于 
每 个 不 在 U 中 的 顶点 vvEV 一 U), 对 应 有 一 个 数组 分 量 closedge 
Lvj, 用 于 记录 依附 于 顶点 v 和 集合 U 中 顶点 的 具有 最 小 权 值 的 那 
条 边 (u,v) (uEU)。 每 个 数组 分 量 closedge[v] 有 两 个 域 ,其 中 
closedge [vj. mincost 用 于 存放 那 条 边 的 权 值 ， closedge[vj]. vex 用 于 
存放 顶点 u 的 编号 ,图 8-14(b) 一 (人 展示 了 对 图 8-14(a) 所 示 的 连通 
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网 按 普 里 姆 算法 构造 最 小 生成 树 的 过 程 。 在 构造 过 程 中 辅助 数组 
closedge 的 变化 过 程 ,如 图 8-15 所 示 。 其 中 closedge[vj. mincost 王 0 
表示 vEU ,closedge[v] 二 oo0 表 示 v 辣 UU 中 顶点 不 邻接 。 开始 时 U= 
{1) ,所 以 在 所 有 uEU,vEV 一 U 的 边 (u,v) 中 找到 的 权 值 最 小 的 边 
(u,v') 就 是 (1,3), 它 就 是 生成 树 上 的 一 条 边 , 同 时 将 顶点 v'(v 三 3) 
并 人 集合 可 (即使 closedge[3]. mincost 二 0); 然 后 ,对 所 有 V 一 U 中 
的 顶点 v, 查 看 是 否 要 修改 closedgeLvj, 即 当 边 (3,v) 上 的 权 值 小 于 
closedge[v]. mincost 时 (说 明 v 和 集合 U 中 顶点 有 更 小 代价 的 边 ) 就 
要 进行 修改 ,在 例子 中 修改 了 closedgeL5] 和 closedgel 4j。 如 此 重复 ， 
直到 U 一 V 。 
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8-15 ”最 小 生成 树 构造 过 程 中 辅助 数组 的 变化 过 程 
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在 下 面具 体 讨论 普 里 姆 算法 实现 时 ,我 们 假设 网 N 以 耗费 ( 邻 
接 ) 和 矩阵 作为 存储 结构 ,其 定义 如 下 ， 
Wi(Vi,Vv)) EE,; 
co 否则 
其 中 ,wi 表示 边 《vi,vi) 上 的 权 值 ,co 表示 计算 机 允许 的 最 大 整数 。 
图 8-16 是 普 里 姆 算法 的 框图 描述 ， 


cost[i,j]=| 


根据 网 N 的 耗费 矩阵 ,初始 
化 辅助 向 量 , 且 使 V={1) 


定义 生成 树 中 边 的 计数 器 i 
(1 二 1) 
N 一 1 条 边 都 找到 吗 ? Yes 
(i:n—1) 


No 
组 织 依 环 ,利用 壮 助 妆 
组 找 生 成 树 中 第 i 条 边 


(UosV 0) 


输出 此 边 Cuo,v 0) ,把 v o 加 到 u 中 


(closedge[v 0]. mincost 一 0) 


组 织 循环 :对 V 一 U 中 的 每 个 
顶点 V ,检查 是 否 有 同 V 中 


顶点 邻接 的 代价 便 小 的 边 ， 
若 有 修改 closelge[ vj] 


修改 生成 树 边 计数 器 i 
(1: 一 1 十 1) 


图 8-16 普 里 姆 算法 框图 
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该 算法 的 PASCAL 语言 描述 如 下 
PROCEDURE minspamtree-prim (gn: ARRAY [1.. n, 1.. nj OF 
integer); 
VAR v,v0O,w,i:integer; 
BEGIN 
FOR v:=2 TO n DO 
BEGIN 
closedge[v]. vex:=1; closedgefv|]. mincost:=gn[1,vj 
END:; 
closedge[ 1 1]. mincost :一 0; 
FOR i:=1 TO n 一 1 DO 
BEGIN 


w:=maxint; 

FOR v:=2 TO n DO 

IF (closedge[v]. mincost<>0) AND (closedge[v |]. mincost<w) 
THEN BEGIN 


w:=closedgef[v |]. mincost; 


END; 
write(closedgeLv0]. vex ,v0); 
closedge[ v0]. mincost: =0; 
FOR v: 一 2 TO n DO 
IF gn[vO,v]<<closedge[v ]. mincost 
THEN BEGIN 
closedge[v]. mincost :一 gn[Lv0,vj]; 
closedge[Lvj. vex: 一 v0 
END 
END 
END; 
普 里 姆 算法 的 时 间 复 杂 度 为 On2), 同 网 中 的 边 数 无 关 , 所 以 运 
合 于 求 稠密 网 的 最 小 生成 树 。 
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二 、 克 和 鲁 斯 卡尔 算法 


对 于 连通 网 N==(V,E), 开 始 我 们 假设 网 中 每 一 个 顶点 自 成 一 
个 连通 分 量 。 然 后 在 E 中 选择 一 条 权 值 最 小 的 边 (v;,v,) , 若 顶 点 VV 
分 别 属于 两 个 不 同 的 连通 分 量 , 则 加 入 此 边 把 这 两 个 连通 分 量 合并 
为 一 ;否则 ,会 去 此 边 ,再 选择 下 一 条 权 值 最 小 的 边 。 如 此 重复 ,直到 
选 出 n 一 1 条 边 ( 即 合并 为 一 个 连通 分 量 ) 为 止 。 

图 8-17(a) 一 (e) 展 示 了 对 图 8-14(a) 所 示 的 连通 网 按 克 鲁 斯 卡 
尔 算法 构造 最 小 生成 树 的 过 程 。 
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8-17 克 和 鲁 斯 卡尔 算法 构造 最 小 生成 树 的 过 程 
克 鲁 斯 卡尔 算法 的 时 间 复 杂 度 与 网 中 边 的 数目 e。 有 关 , 为 OCel- 
oge)， 它 适用 于 求 稀 朴 网 的 最 小 生成 树 。 


8.5 最 短路 径 


假如 要 在 计算 机 上 建立 一 个 交通 咨询 系统 , 则 可 以 采用 图 的 结 
构 来 表示 实际 的 交通 网 络 。 其 中 ,用 图 的 顶点 表示 城市 ,用 图 的 边 表 
示 城 市 间 的 公路 ,并 考虑 把 城市 间 的 距离 或 公路 上 的 费用 作为 边 上 
的 权 值 。 这 个 咨询 系统 可 以 回答 旅客 各 种 各 样 的 问题 。 例如 :从 A 城 
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到 B 城 是 否 有 通路 ? 有 多 少 条 通路 ? 那 一 条 所 需 时 间 最 少 ? 那 一 条 
途中 经 过 的 城市 最 少 ? 等 等 。 这 就 是 我 们 本 节 中 要 讨论 的 最 短路 径 
问题 .这 里 ,所 谓 最 短路 径 是 指 路 径 上 所 有 边 的 权 值 之 和 为 最 小 的 路 
径 ,而 不 是 指 路 径 上 经 过 的 边 的 数目 最 少 的 路 径 。 考 虑 到 交通 道路 的 
有 向 性 ,所 以 下 面 的 讨论 将 针对 有 向 带 权 图 进行 ,并 称 路 径 的 开始 顶 . 
点 为 源 点 ,最 后 一 个 顶点 为 终点 。 另 外 , 设 弧 上 的 权 值 都 为 正 值 。 

本 节 给 出 两 个 算法 :一 个 是 求 从 指定 源 点 到 其 余 各 顶点 的 最 短 
路 径 ; 另 一 个 是 求 任意 一 对 顶点 间 的 最 短路 径 。 


一 、 从 某 一 源 点 到 其 余 各 项 点 的 最 短路 径 


在 这 里 ,我 们 要 讨论 :对 于 给 定 带 权 有 向 图 G 和 源 点 v, 求 从 v 
到 G 中 其 余 各 项 点 的 最 短路 径 。 对 于 这 个 问题 ,一 种 直观 的 方法 是 
罗列 从 v 到 其 余 一 顶点 的 所 有 可 能 路 径 , 并 进行 比较 ,选择 其 中 最 短 
的 。 例 如 ,对 于 图 8-18 所 示 的 带 权 有 向 图 , 设 源 点 为 vi, 则 从 v 到 v: 
有 三 条 路 径 : 其 一 是 (vi,vz) ,长 度 为 50; 其 二 是 (viyvayviyvz) ,长度 
为 45; 其 三 是 (viyvsyviyva) ,长 度 为 95。 经 比较 ,可 知 从 vi 到 vs 的 最 
短路 径 为 (viyviyviyvz)。 依 此 类 推 , 可 求 出 v: 到 其 余 各 顶点 的 最 短路 
径 , 共 n 一 1 条 。 这 种 方法 虽然 简单 .直观 ,然而 效率 却 不 高 , 且 难 于 在 
计算 机 上 实现 。 
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图 8-18 带 权 有 向 图 及 其 耗费 矩阵 
那么 如 何在 计算 机 上 方便 地 求解 这 个 问题 呢 ? 迪 杰 斯 特 拉 (Di- 
jstra) 提 出 了 - -个 按 路 径 长 度 递增 的 次 序 产 生 最 短路 径 的 算法 。 该 
算法 在 寻找 最 短路 径 过 程 中 ,把 带 权 有 向 图 中 的 顶点 分 成 两 个 集合 
S 和 工 。 凡 以 w 为 源 点 已 求 出 最 短路 径 的 终点 属于 集合 S, 初 始 时 S 
只 包含 vi; 集合 工 包 含 所 有 尚未 确定 最 短路 径 的 顶点 ,初始 时 工 包 
。156。 


含 带 权 有 向 图 中 除 v, 以 外 的 其 它 所 有 顶点 。 算 法 按 各 顶点 与 w 间 的 
最 短路 径 长 度 递增 的 次 序 将 集合 工 中 的 顶点 加 入 到 集合 S 中 。 显 
然 , 在 这 一 过 程 中 ,v 到 集合 S 中 各 顶点 的 最 短路 径 长 度 始终 不 大 
于 vi 到 集合 中 各 顶点 的 最 短路 径 长 度 , 为 了 能 方便 地 实现 这 个 算 
法 ,我 们 引进 - -个 辅助 向 量 dist[1.. nj], 它 的 每 个 分 量 dist[i] 表 示 在 
寻找 过 程 中 当前 所 找到 的 从 vi 到 每 个 终点 vi 的 最 短路 径 ( 不 一 定 是 
真正 所 要 找 的 最 短路 径 ) 长 度 。 它 的 初 态 是 : 若 从 w 到 v; 有 弧 , 则 
dist[i 为 弧 上 的 权 值 ;否则 ,dist[i] 为 co。 显 然 , 从 vi 到 其 余 各 顶点 的 
最 短路 径 中 最 短 的 一 条 路 径 长 度 为 ， 
dist[k |—=min {dist[i] | wET) 
此 路 径 为 (vi,v)。 这 时 把 编号 为 k 的 顶点 从 工 中 删除 ,加 入 到 S 中。 
例如 ,对 图 8-18, 从 vi 出 发 第 一 次 选中 的 最 短路 径 为 (vi,v,) ,那么 下 
一 条 长 度 次 短 的 最 短路 径 是 哪 一 条 呢 ? 首先 ,对 于 集合 工 中 的 每 一 
项 点 vi 来 说 , 当 把 w 加 入 到 S 中 之 后 , 其 最 短路 径 或 者 仍 为 (vi,v) 
或 者 为 (vi ,vi ,vi) ,而 不 会 有 其 它 选择 。 也 就 是 说 ,此 时 从 vi 到 v 的 
最 短路 径 或 者 仍 是 原来 的 ,或 者 是 通过 v 到 vi 的 已 确定 的 最 短路 
径 后 ,再 从 Vv 到 v;。 所 以 ,对 集合 中 每 个 顶点 vj, 当 dist[k] 十 cost 
[kk ,jj 过 dist[j]! 寺 ,修改 dist[ ,使 其 为 ;dist[j]: 一 distLk ] 十 cost[k， 
jj。 例如 ,对 图 8-18 来 说 , 当 把 顶点 vs 加 入 到 S 中 之 后 ,原来 dist[4] 
一 “2 ,要 改 为 distL4] 一 25。 接 下 来 ,我 们 就 可 以 通过 向 量 dist[1. .n]， 
寻找 长 度 次 短 的 最 短路 径 。 例 如 ,对 图 8-18 来 说 ,长 度 次 短路 径 为 从 
vi 到 v: 的 最 短路 径 (v,vayve)。 如 此 重复 ,我 们 就 可 以 求 出 从 w 到 其 
余 各 顶点 的 最 短路 径 。 
根据 上 述 分 析 ,我 们 可 以 用 图 8-19 所 示 的 框图 来 描述 迪 杰 斯 特 
拉 算 法 。 
根据 此 框图 ,我 们 可 用 PASCAL 语言 描述 此 算法 。 
TYPE 
st 一 Set of 1..n; 
PROCEDURE shortpath-dij(cost : ARRAY [1..n,1..n] of integer; 
VAR distLl. .nj OF integer; VAR path:ARRAY [1..n] OF st) 
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根据 耗费 矩阵 cost, 初 始 化 


向 量 dist, 并 初始 化 从 Vi 到 
其 余 各 顶点 的 路 径 


集合 S 初 始 化 : S==[V]; 初 
始 化 顶点 计数 器 !Gi 一 1) 


所 有 顶点 都 已 确定 了 最 短 Yes(i=n) 
No(i 过 =n 一 1) 
组 织 循环 ,通过 向 量 dist， (结束) 


从 集合 T 中 选取 具有 当前 
最 短 的 最 短路 径 的 终点 


将 Vk 加 入 到 集合 S 中 


组 织 循环 :对 集合 T 中 的 各 顶点 
测试 并 修改 其 dist 


修改 顶点 计数 器 (1: 二! 十 1) 


图 8-19 迪 杰 斯 特 拉 算法 框图 
VAR s.:st; 
: isk,w:integer; 
BEGIN 
FOR i;=1 TOn DO 
BEGIN 
dist[i |]: =cost[L1,1]; 
IlF dist[i |]<maxint 
THEN path[ij: =[1jJ 二 [i 
ELSE path[ij:=[ | 
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END; 
s=[1]; 
FORi:=] TO n—l1 DO 
BEGIN + 
w: 一 maxint;y k:;=1]; 
FOR j:=1 TOn DO 
IF NOT (j in s) AND (dist[j]<w) 
THEN BEGIN k:=j; w:=dist[i] END; 
s: 一 s 十 [kj]; 
FOR j:=1 TOn DO 
IF NOT Gin s) AND (dist[k] 十 cost[k ,jj<dist[j]) 


THEN BEGIN 
dist[j]: =dist[k ]++cost[k ,j]; 
path[Ljj :一 path[Lk] 十 [] 
END 
END 
END; 


对 于 图 8-18 所 示 的 带 权 有 向 网 ,采用 上 述 算法 ,其 计算 过 程 中 
dist 和 path 的 变化 情况 如 图 8-20 所 示 ，。 


dist[ 让 和 path [i) 


(Vi,V,) (Vi, V3) (VisVs) 


50- 10* 25 45 
(Vi »V2) (Vi, V3) (Vi,Vs, V4) (Vi,Vs) 
5 


4 45 10* 25* 45 
(Vi,V3, Vs,sV,) (Vi,Vs) (Vi,Vs, Vs) (Vi,sVs) 


45* 10* 25* 45 
(Vi,V3, Va, V2) (V1i, Vs) (Vi Va, V4) (Vi,Vs) 


45” 10 29 45” 


图 8-20 从 Vi 到 其 余 各 顶点 的 最 短路 径 计 算 过 程 


分 析 这 个 算法 ,我 们 可 看 出 ,第 一 个 FOR 循环 的 时 间 为 OCn)， 
“199's 


第 二 个 FOR 循环 共 进 行 n 一 1 次 ,每 次 内 循环 的 执行 时 间 为 On)， 
所 以 总 的 时 间 是 O(n?)。 


二 、 每 一 对 顶点 间 的 最 短路 径 


现在 我 们 要 讨论 带 权 有 向 图 中 , 求 任 何 一 对 顶点 间 的 最 短路 径 
的 问题 我们 可 以 每 次 以 一 个 顶点 为 源 点 ,重复 执行 上 述 迪 杰 斯 特 拉 
算法 n 次, 这样, 便 可 以 求 出 图 中 每 一 对 顶点 之 间 的 最 短路 径 。 显 然 ， 
其 时 间 复 杂 度 为 O(n')。 

我 们 要 介绍 求解 这 一 问题 的 另外 一 个 算法 。 它 的 时 间 复杂 度 虽 
然 仍 为 O(n’) ,但 形式 上 要 简单 一 些 。 这 个 算法 由 弗 洛 伊 德 (Floyd) 
提出 。 算 法 中 仍 以 耗费 矩阵 cost 作为 带 权 有 向 图 的 存储 结构 ,其 算 
法 思想 是 : 

假设 求 顶点 w 到 vi 的 最 短路 径 。 开 始 ,我 们 把 cost[i, 订 作为 从 v 
到 vi 的 路 径 上 没有 中 间 顶 点 的 最 短路 径 长 度 ( 当 长 度 为 oo 时 ,表示 
无 路 径 ) 。 当 然 , 这 条 路 径 是 否 为 要 找 的 最 短路 径 , 还 需 进 行 n 次 试 
探 ;首先 考虑 让 路 径 经 过 顶点 wm ,比较 (vvi) 和 (vvyvi) 的 路 径 长 
度 , 取 两 者 中 较 短 者 为 从 v; 到 vj 的 路 径 上 中 间 顶 点 序号 不 大 于 1 的 
最 短路 径 。 在 这 基础 上 再 考虑 让 路 径 经 过 顶点 vs, 也 就 是 说 , 铬 我 们 
已 经 有 了 (vvm)、Cvm va vv) ,它们 分 别 表示 从 w 到 
Vi 从 Vi 到 Vy、 从 V2 到 Vi 的 中 间 顶 点 序号 不 大 于 1 的 最 短路 径 , 那 
么 ,就 可 以 比较 (vvv…vi) 和 (vvi) 的 路 径 长 度 , 取 较 短 者 
为 从 vi 到 vi 的 路 径 上 中 间 顶 点 序号 不 大 于 2 的 最 短路 径 。 再 考虑 让 
路 径 经 过 顶点 v;, 依 次 类 推 。 一 般 情况 下 , 若 我 们 已 经 有 了 从 vi 到 
ve 从 Vv 到 vv 和 从 vi 到 vi 的 中 间 顶 点 序号 不 大 于 k 一 1 的 最 短路 径 
(vv) (vvi) (vvi), 则 我 们 接 下 来 考虑 让 路 径 经 过 顶 
点 上 ,比较 (vv…yv) 和 (vvi) 的 路 径 长 度 , 取 较 短 者 为 从 
vi 到 vj 的 路 径 上 中 间 顶 点 序号 不 大 于 上 的 最 短路 径 。 如 此 进行 n 次 
试探 ,就 得 到 了 从 vi 到 vi 的 路 径 上 中 间 顶 点 序号 不 大 于 n 的 最 短路 
径 , 这 也 就 是 我 们 要 求 的 最 短路 径 。 

为 了 实现 上 述 算法 ,我们 定义 一 个 n 阶 方 阵 的 序列 : 
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Ac ,AG ,A ,， ,A®™ 
其 中 ,A[i,j]=-cost[i, 让 
AM[iI mn(A ?inlA DHik| 直 FA Nk |} 
js 

由 上 述 计算 公式 可 见 ,A 中 i, 让 表示 从 vi 到 vj; 的 中 间 顶 点 序号 不 大 
于 上 的 最 短路 径 长 度 。 另外 ,为 了 记录 从 vi 到 vj 的 最 短路 径 , 需 要 再 
定义 一 个 n 阶 方 阵 的 序列 Path ,path”,…,path'”。 其 中 path" [i， 
让 用 于 记录 从 vi 到 vi 的 中 间 顶 点 序号 不 大 于 k 的 最 短路 径 。 例 如 ,对 
图 8-21 所 示 的 带 权 有 向 图 ,按照 弗 洛 伊 德 算法 ,可 得 到 如 图 8-22 所 
示 的 两 个 矩阵 序列 。 


(a) 带 权 有 向 图 (b) 耗 费 矩 阵 


8-21 带 权 有 向 图 及 其 耗费 矩阵 


‘ww 5 11 co 5 11 
A 人 一 |10 oo 4 AD 一 |10 co 4 
3 co oo 3 8 CO 
‘> 5 9 co 5 9 
AI 一 |l10 co 4 Ad 一 |7 co 4 
3 8 oo 3 8 oo 
/ AB AC / AB AC 
”path‘" 一 区 2 ec | path‘1 = 网 / ec 
CA / / CA CAB / 
/ AB ABC / B ABC 
path‘?) 一 区 / BC path‘3 一 区 7/ ee | 
CA CAB / CA CAB / 


图 8-22 弗 洛 伊 德 算 法 计算 过 程 中 各 对 顶点 间 的 最 短路 径 及 长 度 
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图 8-23 是 弗 洛 伊 德 算法 的 框图 描述 。 


组 织 循 环 ; 根 据 Cost 建 立 A\《o) 和 patkfo) 


初始 化 插入 到 路 径 中 的 顶点 序号 k(k: 二 1) 


Yes(k >n) 


所 有 顶点 都 试探 了 吗 ? (k:n) 


当 A[i,k] 十 A[k,j]<zA[i,jj 时 ,修改 
A[i,jj 和 path[i,]] 


修改 插入 顶点 的 序号 (k: 二 k 十 1) 


图 8-23 弗 洛 伊 德 算法 框图 
这 个 算法 的 PASCAL 语言 描述 ,请 读者 根据 框图 自己 完成 。 


8.6 有 向 无 环 图 及 其 应 用 


一 、 有 向 无 环 图 


所 谓 有 向 无 环 图 就 是 指 没 有 环 的 有 向 图 ,简称 DAG 图 。 例 如 ， 
图 8-24(a) 、(b) 分 别 为 有 回 无 环 图 和 非 DAG 图 

有 向 无 环 图 是 描述 一 项 工程 进度 安排 或 一 个 系统 运行 过 程 的 有 
效 工具 .除了 最 简单 的 情况 外 ,一 个 工程 一 般 均 可 分 为 若干 个 被 称 为 
活动 的 子 工程 ,而 这 些 子 工程 之 间 通 常 受 着 一 定 条 件 的 约束 ,如 其 中 
某 些 子 工程 的 开始 ,必须 在 另 一 些 子 工 程 完成 之 后 等 。 用 DAG 图 描 
述 工程 进度 安排 ,一 般 有 二 种 形式 ;其 一 是 以 图 中 的 顶点 表示 活动 ， 
弧 表示 活动 之 间 的 先后 关系 ,这 时 有 向 无 环 图 称 为 用 顶点 表示 活动 
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(a) 有 疝 无 环 图 (b) 非 DAG 图 


图 8-24 有 向 无 环 图 与 非 DAG 图 

的 网 (Activity On Vertex network ) ,简称 为 AOV 网 ;其 二 是 以 图 中 
的 弧 表 示 活 动 ,以 顶点 表示 活动 的 开始 或 结束 等 事件 ,并 且 以 弧 上 的 
权 值 表示 活动 所 持续 的 时 间 , 这 时 有 向 无 环 图 称 为 用 边 表 示 活 动 的 
网 (Activity On Edge network) ,简称 为 AOE 网 。 对 于 一 个 工程 或 一 
个 生产 流程 ,人 们 一 般 关 心 的 最 基本 的 两 个 问题 是 :第 一 ,工程 能 否 
顺利 进行 ? 第 二 ,要 估算 整个 工程 完成 所 必须 的 最 短 时 间 。 下面 分 别 
讨论 这 两 个 问题 。 


二 、 拓扑 排序 


所 谓 拓扑 排序 就 是 由 某 个 集合 上 的 一 个 偏 序 得 到 该 集合 上 的 一 
个 完全 序 。 也 就 是 说 要 构造 AOV- 网 中 所 有 顶点 的 线性 序列 ,使 得 此 
序列 中 不 仅 保 持 网 中 各 顶点 间 原 有 的 先后 关系 ,而 且 使 原来 没有 先 
后 关系 的 顶点 之 间 建 立 一 种 人 为 的 先后 关系 ,这 种 线性 序列 称 为 拓 
扑 有 序 序列 ,构造 AOV- 网 的 拓扑 有 序 序列 的 过 程 即 为 拓扑 排序 。 直 
观 地 看 , 偏 序 集合 中 只 有 部 分 元 素 可 比较 ,完全 序 集合 中 全 体 元 素 都 
可 比较 。 例 如 ,图 8-25 所 示 , (a) 表 示 偏 序 , 其 中 ,V2 与 v3 之 间 无 法 
比较 ;(b) 表 示 完 全 序 。 


2 
CD ROR 
(3) 
(a) 偏 序 (b》 完全 序 
8-25 ”表示 偏 序 和 完全 序 的 有 向 图 
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如 果 一 个 AOV- 网 的 所 有 顶点 都 在 它 的 拓扑 有 序 序列 中 , 则 该 
AOV- 网 中 不 存在 有 向 回路 ,该 网 所 表示 的 工程 按 拓 扑 有 序 序列 中 
的 先后 次 序 安 排 其 子 工程 ,工程 就 可 顺利 完成 。 当 然 , 一 个 AOVY- 网 ， 
其 拓扑 有 序 序列 不 一 定 唯 一 。 例 如 ,图 8-26(a) 所 示 的 AOV- 网 ,其 拓 
扑 有 序 序列 有 以 下 三 个 (A,B,C,D,F,E)、(A,B,D,C,F,E) 和 (A， 
D,B,C,E,F). 


(a) AON- 网 (b) 邻接 表 
图 8-26 AOV- 网 及 其 邻接 表 

如 何 进 行 拓扑 排序 呢 ? 我 们 可 以 按 如 下 步骤 进行 : 

(1) 在 AOV- 网 中 选择 一 个 没有 前 驱 的 顶点 vi, 并 输出 之 ; 

(2) 在 AOV- 网 中 删除 顶点 vi 和 以 vi 为 弧 尾 的 弧 ; 

(3) 重复 (1) 和 (2) ,直到 网 中 所 有 顶点 都 被 输出 ,或 网 中 不 存在 
没有 前 驱 的 顶点 。 前 者 说 明 网 中 没有 环 ,后 者 说 明 网 中 有 环 。 

以 图 8-26(a) 中 的 有 向 图 为 例 ,首先 选取 没有 前 驱 的 顶点 A 进 
行 输出 ,并 在 网 中 删 去 顶点 A 和 从 A 发 出 的 弧 (A,B)、(A,D)。 然 
后 ,再 选取 没有 前 驱 的 顶点 ,这 时 ,顶点 B 和 DD 都 没有 前 驱 , 可 以 任 
选 一 个 ,比如 D, 输 出 之 ,并 删除 D 及 4D,E)。 依 次 类 推 ,最 后 将 网 中 
的 顶点 全 部 输出 ,就 得 到 了 该 网 的 一 个 拓扑 有 序 序列 (A,D,B,C， 
F,E). 

那么 ,如 何在 计算 机 上 实现 上 述 算法 呢 ? 首先 ,我 们 要 解决 
AOV- 网 的 存储 结构 问题 。 根 据 算法 进行 的 操作 ,可 以 选择 邻接 表 作 
为 AOV- 网 的 存储 结构 , 且 在 头 结 点 中 增加 一 个 存放 顶点 入 度 的 数 
据 域 (indegree)。 入 度 为 零 的 顶点 就 是 没有 前 驱 的 顶点 。 例 如 ,图 
8-26(a) 所 示 的 有 向 图 的 邻接 表 如 图 8-26(b) 所 示 。 当 要 删除 从 某 顶 
点 发 出 的 弧 时 ,可 以 对 该 红 所 到 达 的 顶点 的 人 度 减 1 来 实现 。 同 时 ， 
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为 了 避免 重复 检测 人 度 为 零 的 顶点 ,可 以 设置 -个 堆栈 用 于 存放 人 
度 为 零 的 顶点 这 个 堆栈 可 以 另外 开辟 ,也 可 以 借用 头 结 点 中 值 为 堆 
的 人 度 域 来 存放 堆栈 中 的 指针 (以 指示 下 一 个 人 度 为 零 的 顶点 序 
号 )。 以 图 8-26(a) 所 示 的 有 向 图 为 例 , 图 8-27(b) 为 拓扑 排序 前 ,入 
度 为 零 的 顶点 入 栈 后 的 状态 。 其 中 ,top 为 栈 顶 指 针 ; 图 8-27(c) 表 示 
项 点 A 输出 之 后 ,由 于 B,D 的 人 度 相继 为 零 而 人 栈 , 则 栈 顶 指针 指 
向 D,D 的 指针 指向 B,B 的 指针 为 零 (表示 栈 底 ) 。 依 次 类 推 ， 


a 
ol 
ln ho] 
ro oi 
wl le) 


top=6 top=5 top=0 
(f) (g) (h) 


图 8-27 拓扑 排序 过 程 中 入 度 域 的 变化 情况 
图 8-28 为 上 述 算法 的 框图 描述 。 
其 PASCAL 语言 描述 如 下 : 
TYPE vexnode 王 RECORD 
vexdata :char; 
indegree :integer ; 
firstarc ;arcptr; 
END:; 
adjlisttp :一 ARRAY [1..nmax] OF vexnode; 
FUCTION topsort (VAR dig :adjlisttpy n :integer) :boolean; 
VAR p:arcptr; 
lmytop :integer; 
BEGIN 
top :一 0; 
FOR i:=1 TOn DO 
IF diglil. indegree=0 THEN 
BEGIN 
dig[i]. indegree; = top; 
top : 一 1 
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END; 
my: 一 0; 
WHILE top=>0 DO 
BEGIN 
write(dig[topj. vexdata); m: 一 m 十 1; 
p: 一 dig[Ltop]. firstarc; 
top :一 dig[Ltop j.indegrees 
WHILE p<>nil DO 
BEGIN 
k :一 p 个 .adjvex; 
dig[k ]. indegree; = dig[k j. indegree-1; 
IF dig[k |. indegree=0 THEN 
BEGIN 
dig[k ]. indegree :一 top; 
top: 一 上 
END; 
p: 一 p 不 .nextarc 
END 
END; 
IF m<n THEN return (false) 
ELSE return (true) 
END:; 


对 于 一 个 有 n 个 顶点 和 e 条 弧 的 有 向 图 ,算法 搜索 入 度 为 0 的 
顶点 的 时 间 为 O(n); 当 网 中 不 存在 环 时 ,每 个 顶点 需 入 栈 一 次 和 出 
栈 一 次 ,而 且 顶 点 入 度 减 1 的 操作 需 执 行 e 次 ;所 以 ,总 的 时 间 复 杂 
度 为 O(n 十 e)。 


三 、 关 键 路 径 


上 面 我 们 运用 AOV- 网 讨论 了 一 个 工程 能 否 顺 序 进行 的 问题 ， 
下 面 我 们 运用 AOE- 网 讨论 :完成 一 个 工程 至 少 需 多 少时 间 ? 以 及 哪 
些 活 动 是 影响 工程 进度 的 关键 ? 

用 AOE- 网 表示 一 项 工程 的 施工 计划 时 ,顶点 所 表示 的 事件 是 
指 所 有 以 该 顶点 为 驱 头 的 弧 所 表示 的 活动 都 已 完成 ,以 及 以 该 顶点 
为 弧 尾 的 弧 所 表示 的 活动 都 可 以 开始 。 例 如 ,图 8-29(a) 所 示 是 一 个 
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( 开始 ) 
栈 顶 指针 初始 化 (top 一 o); 
建立 输出 顶点 数 计 数 器 m(m:=:o) 
组 织 循环 :使 人 度 为 零 的 顶点 人 栈 
No 
有 人 度 为 零 的 顶点 吗 ? 


Yes Yes 
网 中 顶点 都 被 输出 吗 ? 
输出 械 顶 元 素 k, 且 使 它 出 栈 ; 
No 计数 器 m 加 1, 并 建立 链表 搜索 指针 p 


网 中 有 环 / 
k 的 后 继 都 测试 完 吗 ? 各 
结束 | No 


由 p 所 指 的 k 的 直接 后 继 顶 点 j 的 人 度 减 1 


p 指 向 k 的 下 一 直接 后 继 


图 8-28 拓扑 排序 的 算法 框图 
具有 8 个 子 工 程 (活动 ) 的 AOE- 网 ,网 中 有 六 个 顶点 ,分 别 表 示 六 个 
事件 。 其 中 ,顶点 w 表示 整个 工程 可 以 开始 , 即 子 工程 a .as 可 以 开 
工 ,顶点 w 表示 子 工程 av\as 完工 而 子 工程 ay 可 以 开工 ,等 等 。 弧 上 
的 权 值 表示 该 弧 所 代表 的 活动 的 计划 用 时 间 。 例 如 ,活动 a 计划 需 
花 3 天 时 间 完 成 。 
由 于 整个 工程 只 有 一 个 开始 点 和 一 个 完成 点 ,分 别 表示 整个 工 
程 的 开工 和 完工 ,所 以 ,在 正常 情况 下 ,AOE- 网 中 不 仅 无 环 ,而 且 只 
有 一 个 人 度 为 零 的 顶点 和 一 个 出 度 为 零 的 顶点 ,分 别称 为 源 点 和 
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(b) 


图 8-29 AOE- 网 及 其 关键 路 径 
汇 点 。 

在 AOE- 网 中 有 些 活动 能 同时 进行 ,所 以 ,完成 整个 工程 所 必需 
的 时 间 是 从 开始 顶点 到 结束 顶点 的 最 长 的 带 权 路 径 的 长 度 , 这 条 路 
径 称 为 关键 路 径 。 关 键 路 径 上 的 所 有 活动 称 为 关键 活动 。 显 然 , 任 何 
一 项 关键 活动 若 不 能 按期 完成 ,都 要 影响 到 整个 工程 的 工期 ;而 提高 
关键 活动 的 速度 ,可 以 缩短 工期 。 例 如 ,在 图 8-29 所 示 的 AOE- 网 
中 ,关键 路 径 为 (v1,v3,V4,vVs) ,其 长 度 为 2 十 4 十 2 二 8, 关 键 活 动 为 az、 
as、a7。 如 果 提 高 as 的 速度 ,使 其 由 原 计划 的 4 天 减少 到 用 3 天 完成 ， 
则 整个 工程 可 提前 一 天 完工 。 但 若 进一步 提高 as 的 速度 ,使 其 只 用 2 
天 完成 ,整个 工程 是 否 可 以 在 6 天 内 完成 呢 ? 显然 不 能 ,因为 当 as 一 
2 时 ,关键 路 径 就 变化 了 。 如 果 在 AOE- 网 中 存在 两 条 以 上 的 关键 路 
径 ,必需 同时 提高 这 几 条 关键 路 径 上 某 个 关键 活动 的 速度 ,才能 缩短 
工期 。 而 提高 非 关 键 活 动 的 速度 不 能 加 快 整个 工程 的 进度 。 

由 以 上 分 析 可 知 , 要 对 工程 计划 进行 有 效 的 安排 和 调度 ,首先 应 
求 出 其 对 应 的 AOE- 网 的 关键 路 径 和 关键 活动 。 为 了 计算 关键 活动 ， 
先 定义 几 个 有 关 的 变量 。 

1. 事件 的 最 早 发 生 时 间 VeQj) 

Ve(j) 是 指 从 源 点 vi 到 顶点 vi 的 最 长 带 权 路 径 长 度 , 这 个 时 间 
决定 了 所 有 从 vi 发 出 的 弧 所 表示 的 活动 能 够 开工 的 最 早 时 间 。 

Ve(G) 的 计算 方法 如 下 : 

Ve(1) 一 0; 

VeG) 一 max{Ve(GD) 十 dut((vv)))， (visv ET.2<=j<=n。 
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其 中 ,下 表示 所 有 以 顶点 Vj 为 红 头 的 红 ,dut(CCviyvi) 为 踊 (viyvi) 上 
的 权 值 ,n 为 网 中 顶点 数 。 

显然 ,这 是 一 个 从 源 点 开始 的 递 推 公 式 ,VeG) 的 计算 必须 在 项 
点 vi 的 所 有 前 驱 顶 点 的 最 早 发 生 时 间 全 部 求 出 后 才能 进行 ;所 以 ， 
必须 对 AOE- 网 进行 拓扑 排序 , 按 拓 扑 有 序 序列 逐个 求 出 各 个 顶点 
所 表示 事件 的 最 早 发 生 时 间 。 例 如 ,图 8-29(a) 中 的 顶点 vt, 其 最 早 
发 生 时 间 Ve(4) 是 在 求 得 Ve(1) 二 0,Ve(2) 二 3,Ve(3) 二 2 之 后 , 才 
可 求 得 : 

Ve(4) 王 max{Ve(2) 十 3,Ve(3) 十 4} 一 6 

2. 事件 的 最 晚 发 生 时 间 ViGD) 

VI1(D 是 指 在 不 推迟 整个 工程 完成 日 期 的 前 提 下 事件 vi 所 允许 
的 最 晚 发 生 时 间 。 对 于 一 个 工程 来 说 ,计划 用 几 天 完成 是 可 以 从 
AOE- 网 中 求 得 的 ,其 数值 就 是 汇 点 w 的 最 早 发 生 时 间 Ve(n), 而 这 
个 时 间 也 就 是 Vi(n)。 其 他 顶点 事件 的 最 晚 发 生 时 间 应 从 汇 点 开始 ， 
逐步 向 源 点 方向 递 推 才 能 求 出 ,所 以 VIG) 的 计算 公式 应 是 : 

Vi(n)= Vel(n) 
VQ)=min{ViO)—dut((vi,vi))} (Vi, VJ) ES,1<=i<=n~—1 
其 中 ,S 是 所 有 从 vi 发 出 的 弧 的 集合 。 

显然 ,VIGD 的 计算 必须 在 vi 的 所 有 后 继 顶 点 的 最 晚 发 生 时 间 全 
部 求 出 后 才能 进行 ;所 以 必须 对 AOE- 网 进行 闭 拓 扑 排序 ,然后 按 逆 
拓扑 有 序 序列 进行 递 推 求 出 各 顶点 事件 的 最 晚 发生 时 间 。 例 如 ,图 
8-29(a) 中 的 顶点 v2, 其 V1(2) 是 在 先 求 出 V1(6) 二 8, V1(5) 二 7,V1l 
(4) 王 6 之 后 才 可 求 得 : 

V1(2)=min{V1I(5)—3,V1(4)—2}=4 

3. 活动 的 最 早 开 始 时 间 Ee(D 

Ee(i) 是 指 a; 所 表示 的 活动 最 早 可 以 开工 的 时 间 。 帮 活动 a 是 由 
弧 (viyv) 表 示 , 则 Ee(i) 二 VeQj)。 这 说 明 , 活 动 ai 的 最 早 开 工 的 时 间 
等 于 事件 vi 最 早 发 生 时 间 。 

4. 活动 的 最 晚 开始 时 间 ElG) 

El(GD 是 指 在 不 推迟 整个 工程 完成 日 期 的 前 提 下 ,活动 ai 最 晚 允 
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许 开 始 时 间 。 若 活动 ai 由 弧 ( 人 vv 表示, 则 ; 
ElG) 一 VLGk) —dut(lv,, ve)) 

对 于 活动 ai 来 说 ,El1(i) 一 Ee(i) 表 示 完 成 活动 a; 的 时 间 余 量 。 若 Ee 
(i) 二 El1() ,表明 该 活动 的 最 早 开工 日 期 同系 统 允 许 该 活动 的 最 述 开 
工 日 期 相等 ;也 就 是 说 如 果 活 动 ai 不 能 按时 完工 , 则 整个 工程 就 要 
延期 ,所 以 它 是 一 个 关键 活动 .显然 , 求 出 网 中 的 所 有 关键 活动 之 后 ， 
也 就 是 求 出 了 关键 路 径 。 

根据 上 面 的 分 析 , 求 AOE- 网 的 关键 路 径 的 算法 可 按 以 下 步骤 
进行 : : 

(1) 从 源 点 vi 出 发 , 令 Ve(1)==0, 按 拓扑 有 序 序列 求 其 余 各 顶 
点 的 最 早 发 生 时 间 Ve(i) (2 三 =i 过 =n)。 如果 得 到 的 拓扑 有 序 序列 
中 顶点 个 数 小 于 网 中 顶点 数 n, 则 说 明 网 中 存在 环 ,不 能 求 关 键 路 
径 , 算 法 终止 ;否则 执行 步骤 (2)。 

(2) 从 汇 点 vo 出 发 , 邻 Vl(n)= 二 Vel(n), 按 道 拓扑 有 序 序列 求 其 
余 各 顶点 的 最 述 发 生 时 间 VlGi) (1 过 =i<=n 一 1)。 

(3) 根据 各 顶点 的 Vl 和 Ve 值 , 求 出 每 个 活动 ai 的 最 早 开 始 时 
间 和 最 晚 开 始 时 间 ，, 同时 若菜 活动 a 满足 Ee(i) 二 El(i)。 则 ai 为 关 
键 活动 。 依 次 输出 这 些 关 键 活 动 。 

例如 ,图 8-29(a) 所 示 的 网 ,其 按 上 述 算法 的 计算 结果 如 图 8-30 
所 示 。 可 见 a,,as 和 a; 为 关键 活动 ,组 成 一 条 从 源 点 到 汇 点 的 关键 路 
径 , 如 图 8-29(b) 所 示 。 
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图 8-30 AOE- 网 中 顶点 的 发 生 时 间 和 活动 的 开始 时 间 
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向 图 的 邻接 矩阵 如 下 : 


(1) 画 出 该 有 加 图; 

(2) 求 每 个 顶点 的 人 /出 度 ; 
(3) 画 出 邻接 表 ; 

(4) 画 出 逆 邻 接 表 ; 

(5) 求 强 连通 分 量 。 


2. 编写 在 有 n 个 顶点 的 有 向 图 的 邻接 表 上 , 统计 每 个 顶点 的 
入 度 、 出 度 和 度数 的 算法 。 


. 试 利用 栈 编 写 按 深度 优先 搜索 策略 , 遍历 一 个 强 连 通 图 的 


非 递 归 算 法 ， 要 求 图 用 邻接 表 作 为 存储 结构 。 
4. 设 一 个 无 向 带 权 图 的 耗费 矩阵 如 下 所 示 , 请 写 出 它 的 邻接 
表 , 并 用 克 鲁 斯 卡尔 算法 求 其 最 小 生成 树 。 
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径 的 Dijkstra 算法 。 
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储 结构 实现 求 从 源 点 到 其 余 各 顶点 的 最 短路 


全 上 这 


第 九 日 查 找 


在 本 书 的 第 三 日 到 第 八 日 中 ,我 们 讨论 了 各 种 线性 或 非 线性 的 
数据 结构 及 其 应 用 ,在 第 九 日 和 第 十 日 中 ,我 们 将 介绍 应 用 数据 结构 
来 解决 实际 问题 时 ,经 常 遇 到 的 两 种 技术 一 一 查找 和 排序 。 

查找 就 是 检索 , 亦 即 查 表 。 查 表 是 由 同一 类 型 的 数据 元 素 ( 或 称 
记录 ) 组 成 的 集合 ;集合 中 的 每 个 记录 有 若干 个 域 组 成 ,其 中 用 于 区 
分 表 中 各 个 记录 的 域 称 为 关键 字 域 ,其 值 称 为 关键 字 。 所 谓 查 找 就 是 
根据 给 定 的 某 个 值 ,在 查找 表 中 寻找 关键 字 值 等 于 K 的 记录 的 过 
程 。 若 表 中 存在 这 样 的 记录 ,也 就 是 说 找到 这 样 的 记录 , 则 称 查找 成 
功 , 此 时 查找 的 结果 为 给 出 整个 记录 的 信息 ,或 指示 该 记录 在 查找 表 
中 的 位 置 ; 若 表 中 不 存在 关键 字 值 等 于 给 定 值 K 的 记录 , 则 称 查找 
不 成 功 ,此 时 查找 的 结果 可 给 出 空 " 记 录 或 空 指针 。 

查找 的 方法 很 多 ,对 于 不 同 的 结构 需 采 用 不 同 的 方法 。 本 日 主要 
介绍 静态 查找 表 、 动 态 查找 表 和 哈 希 表 的 查找 。 


9.1 静态 查找 表 


在 静态 查找 表 中 ,记录 按 其 逻辑 顺序 存放 在 计算 机 存储 器 中 ,并 
且 在 查找 过 程 中 , 表 中 元 素 不 会 发 生变 化 。 静 态 查找 表 可 以 有 不 同 的 
表示 方法 ;在 不 同 的 表示 方法 中 ,其 查找 操作 的 实现 方法 也 不 同 。 


一 、 顺 序 表 的 查找 


若 静 态 查 找 表 采 用 顺序 存储 结构 , 则 称 为 顺序 表 ; 此 时 查找 操作 
可 用 顺序 查找 来 实现 。 顺 序 查找 是 最 简单 的 一 种 查找 方法 , 它 是 用 给 
“ie . 


_ 定 的 值 与 表 中 各 个 记录 的 关键 字 逐 个 进行 比较 , 若 某 个 记录 的 关键 
字 值 和 给 定 值 相等 , 则 查找 成 功 ;反之 , 若 找 遍 表 中 所 有 记录 ,其 关键 
字 值 和 给 定 值 均 不 等 , 则 表明 表 中 没有 所 查 记录 ,查找 不 成 功 ,下 面 ， 
我 们 在 顺序 存储 结构 上 讨论 这 种 查找 方法 的 实现 。 图 9-1 是 顺序 查 
找 算法 的 框图 描述 。 


建立 前 哨 站 :在 表 头 增加 一 个 记录 ， 
令 其 关键 字 为 k(r[0j. key: 一 Kk) 


令 查找 指针 指向 表 昆 记录 
(1: =n) 
第 i 个 记录 的 关键 字 是 否 等 于 k 
No 
修改 指针 (i;: 一 i 一 1) 


图 9-1 顺序 查找 算法 的 框图 
算法 的 PASCAL 语言 描述 如 下 : 

CONST nmax 一 ( 表 中 记录 的 最 大 数目 }; 
TYPE node=RECORD 

key :integerj; 

ch :char 

END; 
sqlisttp= ARRAY [0. .nmax] OF node; 
FUNCTION seqsrch(r:sqlisttp; n,k :integer) :integer; 
VAR i:integer; 


BEGIN 
r[0].key:—=k; i=n; 
WHILE r[il]. key=<>k DO i:=i—1; 
return (1) 


sl Wks 


END; 

运行 这 个 算法 ,在 查找 成 功 时 ,将 返回 所 找到 记录 在 向 量 中 的 下 
标 ;否则 ,返回 零 。 在 查找 之 前 先 对 r[0] 的 关键 字 赋值 K, 目 的 在 于 
免 去 查找 过 程 中 每 一 步 都 要 检测 整个 表 是 否 已 查找 完毕 。r[0] 起 到 
了 监视 哨 的 作用 ,这 仅 是 一 个 程序 设计 技巧 上 的 改进 ;然而 实践 证 
明 ,这 个 改进 能 使 顺序 查找 在 n 沁 二 1000 时 ， 进 行 一 次 查找 所 需 的 
平均 时 间 几 乎 减少 一 半 。 当 然 ,监视 哨 也 可 设 在 高 下 标 处 。 

在 前 面 几 日 中 ,分 析 算 法 时 ,主要 分 析 算 法 的 时 间 复 杂 度 和 空间 
复杂 度 .对 于 查找 算法 ,其 执行 时 间 主 要 取决 于 给 定 值 同 关键 字 的 比 
较 次 数 。 所 以 ,在 本 日 以 平均 比较 次 数 作为 衡量 查找 算法 好 坏 的 依据 
之 一 。 对 于 含有 n 个 记录 的 顺序 表 , 查找 成 功 时 平均 查找 长 度 为 ， 

ASL= OPC, ” 
其 中 : P; 为 查找 表 中 第 i 个 记录 的 概率 ,C; 为 查找 第 i 个 记录 时 所 需 
的 比较 次 数 。 

对 于 顺序 查找 算法 ,假设 每 个 记录 的 查找 概率 相等 , 即 P;==1/n 
(1 二 1,…,n) ;而 Ci 取决 于 所 查 记 录 在 表 中 的 位 置 。 如 查找 r[n] 时 仅 
需 一 次 比较 ,而 查找 rL1] 时 需要 n 次 比较 。 一 般 情况 下 ,C; 为 n 一 i 十 
1, 所 以 顺序 查找 成 功 的 平均 查找 长 度 为 ， 

ASL 一 n x* pi 十 (n 一 1) x ps 十 … 十 P。 
二 ]/n(n 十 (n 一 1) 十 … 十 1) 
一 (n 十 1)/2 
而 查找 不 成 功 的 比较 次 数 总 为 n 十 1, 所 以 ,顺序 查找 的 时 间 复 杂 度 
为 DOCn)。 

显然 , 当 静 态 查 找 表 采用 线性 链表 存储 结构 时 ,上 述 顺 序 查找 方 

法 的 思想 也 是 适用 的 。 


二 、 有 序 表 的 查找 


在 静态 查找 表 中 ,如 果 各 记录 的 次 序 是 按 其 关键 字 的 大 小 顺序 
《比如 ,从 小 到 大 的 顺序 ?排列 的 , 则 称 为 有 序 表 。 对 顺序 存储 的 有 序 
外 174 . 、 


表 ( 即 有 序 的 顺序 表 ) 可 采用 折 半 查找 。 

折 半 查找 的 基本 思想 是 : 先 取 表 的 中 间 位 置 记 录 的 关键 字 同 给 
定 值 进行 比较 ,如 果 给 定 值 与 该 记录 的 关键 字 值 相等 , 则 查找 成 功 ; 
否则 ,分 二 种 情况 ,分 别 在 表 的 前 半 部 分 或 后 半 部 分 继续 进行 折 半 查 
找 ( 当 给 定 值 小 于 中 间 记 录 的 关键 字 值 时 , 在 前 半 部 分 进行 查找 ; 否 
则 ,在 后 半 部 分 进行 查找 )。 如 此 反复 , 直到 找到 或 者 查找 区 间 小 于 
零 为 止 。 

例如 :有 如 下 11 个 记录 的 有 序 表 : 

(8,15,18,23,41,56,63,79,82,90,93) 
现 要 查找 关键 字 为 18 和 80 的 记录 。 

设 指针 low 和 hig 分 别 指示 待 查 记 录 所 在 区 间 的 下 界 和 上 界 ， 
指针 mid 指向 区 间 的 中 间 位 置 , 即 mid= (low 十 hig)/2。 查 找 记录 关 
键 字 KK 二 18 的 过 程 为 : 

8 15 18 :23 41 56 63 79 82 90 93 


t + t 
low mid hig 
此 时 r[mid].key>k ,说 明 如 果 待 查 记录 存在 , 必 在 区 间 Llow,mid 一 
1 ] 中 , 故 令 hig 王 mid 一 1。 
8 15 18 23 41 56 63 79 82 90 93 
人 
lbw mid hig 
这 时 ,rLmidj]. key 一 k, 说 明 查 找 成 功 。mid 就 为 该 记录 在 问 量 中 的 位 
置 。 下 面 再 看 查找 记录 关键 字 KK 二 80 的 过 程 。 
8 15 18 23 41 56 63 79 82 90 93 
t t t 
low mid hig 
r[mid]. key<<k , 故 令 low= 二 mid 十 1。 
“ 。175。. 


8 15 18 23 41 56 63 79 82 
| 


low mid 
ri mid ]. key>k, 令 hig=mid—1 
8 15 18 23 41 56 63 79 82 
人 


low mid hig 
rLmid j. key<k, 令 low 王 mid 十 1 
8 15 18 23 41 56 63 79 82 


low mid hig 

r[mid]<k。 令 low 二 mid 十 1 
8 15 18 23 41 56 63 79 82 
1 人 


hig low 


此 时 ,因为 ow 这 hig, 说 明 表 中 没有 关键 字 KK 二 80 的 记录 ,查找 不 成 


上 述 折 半 查找 算法 的 框图 描述 如 图 9-2 所 示 ; 
”这 个 算法 的 PASCAL 语言 描述 如 下 ， 


90 


90 


90 


90 


FUNCTION binsrch(r :sqlisttp; n,k :integer) :integer; 


VAR low ,hig,mid ;integer; 
found :boolean ; 
BEGIN 
low: =1; hig:=n; found :一 false; 
WHILE NOT found AND low= =hig DO 
BEGIN 
mid : 一 (low 十 hig) DIV 2; 
"176。 


hig 


93 


93 


93 


Se 


初始 化 区 间 下 界 和 上 界 指针 (low: 二 1， 
hig :一 nn) 并 设置 查找 成 功 标志 
Flund,; 一 false 


记录 还 未 找到 且 区 间 大 于 0 吗 ? 
Yes 


求 区 间 的 中 间 位 置 ， 
mid , = (low+t hig) Div2 


第 mid 个 记录 的 关键 字 间 k 进 行 比较 


No 


判别 是 否 查 找 成 功 ? 


r[mid ]. key>k r[mid]. key=k r[Lmid]. key<<k 


修改 区 间 上 界 指针 : 置 查找 成 功 标志 修改 区 间 下 界 指针 : 
hig: =mid—1 Found :一 true low :一 mid 十 1 


图 9-2 折 半 查找 算法 框图 
IF r[mid ]. key |>k 
THEN hig :一 mid 一 1 

ELSE IF rlLmid |. key<<k 
THEN low :一 mld 十 1 

ELSE found :一 true 

END; 
IF found THEN return (mid) 
ELSE return (0) 
END; 

折 半 查找 过 程 可 用 图 9-3 所 示 的 二 
叉 树 来 描述 。 二 叉 树 中 每 个 结 点 对 应 有 
序 顺 序 表 中 的 一 个 记录 , 结 点 中 的 值 为 
该 记录 在 表 中 的 位 置 。 从 这 棵 二 叉 树 可 
以 看 出 ,找到 一 个 记录 的 过 程 恰 好 是 走 
了 一 条 从 根 结 点 到 该 记录 对 应 结 点 的 路 
径 , 和 给 定 值 进行 比较 的 次 数 恰 好 为 该 
结 点 在 此 二 叉 树 上 的 层次 数 。 例 如 ,查找 
18 的 过 程 恰好 走 了 一 条 从 根 结 点 到 结 点 @ 的 路 径 , 和 给 定 值 进行 比 

。177。 


9-3 折 半 查找 过 程 
的 二 叉 树 描述 


较 的 次 数 恰好 为 结 点 四 在 此 二 又 树 上 的 层次 数 。. 所 以 , 折 半 查找 算法 
在 查找 成 功 时 进行 比较 的 次 数 最 多 不 超过 相应 二 叉 树 的 深度 , 即 不 
超过 [logsn] 十 1; 这 也 是 查找 不 成 功 时 所 用 的 最 多 比较 次 数 。 

在 等 概率 的 情况 下 , 折 半 查找 成 功 的 平均 查找 长 度 为 


ASL 一 2PC 一 CE te) ee 


显然 , 当 n 较 大 时 ,可 取 ASLuws:*log2n。 可 见 , 折 半 查 找 比 顺序 查找 效 
率 高 ;但 折 半 查找 只 能 适用 于 有 序 表 , 且 限于 顺序 存储 结构 。 


9.2 动态 查找 表 


在 这 一 节 中 ,我 们 将 讨论 动态 查找 表 的 查找 ,动态 查找 表 的 特点 
是 : 表 结 构 本 身 是 在 查找 过 程 中 动态 生成 的 , 即 对 于 给 定 值 K, 若 表 
中 存在 其 关键 字 等 于 K 的 记录 , 则 查找 成 功 返回 ;否则 ,插入 关键 字 
等 于 K 的 记录 。 动态 查找 表 可 有 不 同 的 表示 方法 ;显然 ,不 管 采用 什 
么 表示 方法 ,应 要 求 能 便于 进行 插入 和 删除 操作 ,在 本 节 中 将 讨论 当 
动态 查找 表 以 各 种 树 结构 表示 时 的 查找 方法 。 


一 、 二 文 排序 树 和 平衡 二 又 树 


1. 二 叉 排 序 树 

二 叉 排序 树 或 者 是 一 棵 空 a9 
树 , 或 者 是 具有 下 列 性 质 的 二 的 (53 S 
又 树 : (1) 若 它 的 左 子 树 不 空 ， 堵 的 ”名 od 
则 左 子 树 上 所 有 结 点 的 值 均 小 
于 它 的 根 结 点 的 值 ;(2) 若 它 的 ” Ga) 


(b) 


右 子 树 不 空 , 则 右 子 树 上 所 有 .图 94 二 又 排序 树 示例 

结 点 的 值 均 大 于 等 于 它 葛 根 结 

点 的 值 ; (3) 它 的 左右 子 树 也 分 别 为 二 叉 排 序 树 。 例 如 ,图 9-4 所 示 
为 两 棵 二 叉 排序 树 。 


二 叉 排 序 树 又 称 二 叉 查 找 树 ,根据 上 述 定 义 ,可 以 按照 如 下 过 程 


* 178。 


进行 查找 :首先 将 给 定 值 与 根 结 点 的 关键 字 进 行 比较 , 若 相 等 , 则 查 
找 成 功 ;否则 ,将 依据 给 定 值 同根 结 点 的 关键 字 之 间 的 大 小 关系 ,分 
别 在 左 子 树 或 右 子 树 上 继续 进行 查找 。 显 然 , 这 是 一 个 递归 算法 。 图 
9-5 为 其 框图 描述 。 


返回 指向 根 
结 点 的 指针 


《结束 ) 
9-5 二 叉 排 序 树 查 找 算法 框图 
其 PASCAL 语言 描述 如 下 : 


TYPE bitreptr 一 个 node; 
node 一 record 
key :integery 
lchild ,rchild :bitreptr 
END:; 
FUNCTION bstsrch (t :bitreptr; k :integer) :bitreptr; 
BEGIN 
IF (t=nil) OR (t= ¢.key=k) 
‘THEN return (t) 
ELSE IF t¢.key>k 
THEN return(bstsrch (t 4 .lchild ,k)) 
ELSE return (bstsrch(t 4 .rchild,k)) 
END:; 
例如 ,在 图 9-4(a) 所 示 的 二 叉 排 序 树 中 查找 关键 字 值 等 于 37 的 
记录 ,其 过 程 为 :首先 以 根 结 点 的 关键 字 同 37 进行 比较 ,因为 
。]179。 


37<<45, 则 查找 45 的 左 子 树 ,此 时 左 子 树 不 空 , 且 37 盖 24。 则 继续 查 
找 24 的 右 子 树 , 由 于 37 和 24 的 右 孩子 的 关键 字 值 相等 ,所 以 查找 
成 功 , 返 回 指向 结 点 37 的 指针 。 又 如 ,在 图 9-4(a) 中 查找 关键 字 值 为 
50 的 记录 ,同上 述 过 程 一 样 ,在 50 先后 与 结 点 关键 字 值 45、53 比较 
之 后 ,继续 查找 结 点 53 的 左 子 树 ,由 于 结 点 53 的 左 子 树 为 空 , 说 明 
树 中 没有 待 查 记录 ,所 以 查找 不 成 功 , 返 回 指针 为 “nil”。 

接 下 来 我 们 要 讨论 的 一 个 问题 是 :如何 建立 二 叉 排 序 树 ? 

对 mn 个 记录 的 关键 字 序列 人 ,K= {ki ,ks,…,k,), 当 要 建立 二 又 
排序 树 时 ,就 从 一 个 空 的 二 叉 排序 树 开始 ,将 记录 逐个 插入 到 这 棵 二 
又 排序 树 中 ,插入 的 次 序 就 按 k; 的 下 标 i 的 顺序 进行 ,具体 步骤 如 
下 

(1) 令 关键 字 为 ki 的 记录 结 点 为 二 叉 排序 树 的 根 ; 

(2) 夺 k; 过 ki, 则 令 ks 的 记录 结 点 作为 ki 的 左 子 树 的 根 结 点 ; 
否则 , 令 ks 的 记录 结 点 作为 ki 的 右 子 树 的 根 结 点 。 

(3) 对 ,ks,… ,k, 重复 步骤 (2) 的 操作 。 

例如 ,关键 字 序列 k= 二 {12,20,5,10,21,4,9,10) ,其 建立 二 又 排 ， 
序 树 的 过 程 如 图 9-6(a) 一 (h) 所 示 。 


i 


(h) 
图 9-6 建立 二 叉 排 序 树 的 示例 
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根据 以 上 建立 二 又 排序 树 的 规则 可 以 很 容易 地 写 出 一 个 递归 的 
算法 .下面 我 们 将 介绍 在 二 又 排序 树 上 插入 结 点 的 非 递 归 算 法 ,其 算 
法 框图 如 图 9-7 所 示 : 


插入 结 点 的 关键 字 同 p 结 点 
的 关键 字 进 行 比较 


Oh ER pP 有 右 孩 子 吗 ? 


有 1 有 
修改 搜索 指针 修改 搜索 指针 
p: 一 pf+ .lchild ;一 5 人 .rchild 


播 人 q 作 为 插入 q 作 为 
Pp 的 左 孩 子 Pp 的 右 孩 子 


9-7 二 又 排 序 树 中 插入 结 点 的 算法 框图 
其 PASCAL 语言 描述 如 下 : 
PROCEDURE ins-bstree (VAR t:bitreptry x:integer); 
VAR p,q:bitreptr; 
bool ; boolean ; 
BEGIN | 
new(q); q .key:=x; q‘¢. lchild:=nil; q¢.rchild:=nil; 
IF t=—nil THEN 
t: 二 q 
ELSE BEGIN 
p:=t; bool : 一 false; 
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REPEAT 
IF x<p+ .key THEN 
IF p .lchild<>nil 
THEN p:=p .1child 
ELSE BEGIN 
pf .lchild. =q; 
bool : = true 
END 
ELSE IF p¢.rchild<>nil 
THEN p:;=p¢.rchild 
ELSE BEGIN 
p .rchild:=q; 
bool : 一 true 
END 
UNTIL bool=true 
END 
END; 
过 程 ins_bstree 实现 了 在 二 叉 排序 树 上 插入 一 个 结 点 ,反复 调 
用 这 个 过 程 就 可 以 建立 二 叉 排 序 树 。 容 易 看 出 ,中 序 遍历 二 叉 排 序 树 
可 得 到 一 个 记录 按 关 键 字 的 有 序 序 列 。 这 就 是 说 ,一 个 无 序 序列 可 以 
通过 构造 一 棵 二 叉 排 序 树 而 变 成 一 个 有 序 序列 ;并 且 , 从 上 面 的 插入 
过 程 还 可 以 看 到 ,每 次 插入 的 新 结 点 都 是 作为 二 叉 排序 树 上 新 的 叶 
子 结 点 ,所 以 在 进行 插入 操作 时 ,不 必 移 动 其 它 结 点 。 二 又 排序 树 既 
拥有 类 似 于 折 半 查找 的 特性 ,又 能 方便 地 进行 插入 ,因此 不 失 为 动态 
查找 表 的 一 种 适宜 表示 。 
在 二 叉 排 序 树 上 删除 一 个 结 点 也 很 方便 ,当然 ,删除 某 个 结 点 之 
后 必须 依旧 保持 二 叉 排 序 树 的 特性 。 假 设 在 二 叉 排 序 树 上 被 删除 结 
点 由 P 所 指示 ,其 双亲 结 点 由 指示, 且 不 失 一 般 性 ,可 设 p 为 的- 
左 孩子 , 则 删除 结 点 p 的 操作 可 分 如 下 四 种 情况 进行 。 
(1) p 结 点 为 叶子 , 即 p 没有 左右 孩子 , 则 可 直接 删 去 P。 如 图 
9-8(a) 所 示 。 
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(2) p 结 点 无 左 子 树 ,而 有 右 子 树 , 则 可 用 p 的 右 孩 子 取 代 p。 如 
图 9-8(b) 所 示 。 

(3)P 结 点 有 左 子 树 , 而 无 右 子 树 , 则 可 用 p 的 左 孩 子 取代 p。 如 
图 9-8(c) 所 示 。 

(4) p 结 点 的 左 、 右 子 树 都 存在 , 则 可 以 先 找到 左 子 树 中 关键 字 
最 大 的 结 点 s, 然 后 用 s 来 取代 结 点 p, 并 且 在 左 子 树 中 删除 s 结 点 。 
如 图 9-8(d) 所 示 。 


f f 
一 -AAA 一 
0 (2 
DO (8) (2 
© 
(a) p 为 叶子 (b) p 只 有 右 子 树 (c) p 只 有 左 子 树 ””(d) p 有 左 、 右 子 树 


图 9-8 二 义 排 序 树 中 删除 结 点 示例 

综合 以 上 四 种 情况 ,读者 可 以 自己 写 出 在 二 又 排序 树 上 删除 一 
个 结 点 的 完整 算法 。 

分 析 二 又 排序 树 查找 算法 可 以 看 出 ,在 二 叉 排 序 树 上 查找 其 关 
键 字 值 等 于 给 定 值 的 过 程 , 恰 是 走 了 一 条 从 根 结 点 到 该 结 点 的 路 径 ， 
所 以 , 同 折 半 查找 类 似 , 查 找 时 同 给 定 值 的 比较 次 数 不 超 过 树 的 深 
度 。 但 含有 n 个 记录 的 二 叉 排 序 树 是 不 唯一 的 。 例 如 ,图 9-4(a)、 
(b) 所 示 的 二 棵 二 叉 排序 树 中 结 点 的 值 都 相同 ,但 前 者 由 关键 字 序 列 
(45,24,53,12,37,93) 构 成 ,而 后 者 由 关键 字 序列 (93,53,45,37,24， 
12) 构 成 。(a) 的 深度 为 3, 而 (b) 的 深度 为 6。 再 从 平均 查找 长 度 来 看 ， 
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假设 6 个 记录 的 查找 概率 相等 , 均 为 1/6, 则 (a) 的 平均 查找 长 度 为 ， 
ASL(a) 一 (1 十 2 十 2 十 3 十 3 十 3)/6 王 14/6 
而 (b) 的 平均 查找 长 度 为 : 
ASL(b) 二 (1 十 2 十 3 十 4 十 5 十 6)/6 二 21/6 

所 以 ,含有 nm 个 结 点 的 二 又 排序 树 的 平均 查找 长 度 和 二 又 排序 树 的 
形态 有 关 。 当 先后 插入 的 记录 按 关键 字 有 序 时 ,构成 的 二 叉 排序 树 
将 晓 变 成 为 单 支 树 , 其 深度 为 n, 平 均 查 找 长 度 为 (n 十 1)/2, 此 时 它 
和 顺序 查找 一 样 ,这 是 最 差 的 情况 。 最 好 情况 是 , 当 生 成 的 二 又 排序 
树 中 任 一 结 点 的 左 、 右 子 树 的 深度 相差 不 超过 1 时 ,其 平均 查找 长 度 
同 折 半 查找 相同 .所 以 ,为 了 在 所 构成 的 二 叉 排序 树 上 能 有 效 地 进行 
查找 ,就 要 在 构造 过 程 中 进行 “平衡 化 ”处 理 ,使 之 成 为 平衡 二 叉 树 。 

2. 平衡 二 又 树 

平衡 二 叉 树 又 称 AVL 树 。 它 或 者 是 一 棵 空 树 ,或 者 是 具有 下 列 
性 质 的 二 叉 树 :(1) 它 的 左 子 树 和 右 子 树 都 是 平衡 二 又 树 ;(2) 其 左 、 
右 子 树 深度 之 差 的 绝对 值 不 超过 1。 在 这 里 ,我们 对 二 叉 树 上 的 每 个 
结 点 定义 一 个 平衡 因子 (bf) ,其 值 为 该 结 点 的 左 子 树 的 深度 减 去 它 
的 右 子 树 深 度 。 显 然 ,平衡 二 叉 树 上 所 有 结 点 的 平衡 因子 只 可 能 是 
一 1,0 和 1。 只 要 二 叉 树 上 有 一 个 结 点 的 平衡 因子 的 绝对 值 大 于 1， 
则 该 二 叉 树 就 不 是 平衡 的 。 如 图 9-9(a) 为 一 棵 平衡 二 叉 树 ,而 图 9-9 
(b) 为 一 棵 不 平衡 的 二 叉 树 ( 结 点 中 的 值 为 该 结 点 的 平衡 因子 )。 
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四 © 
Ca) 平衡 二 又 树 (Cb) 不 平衡 二 叉 树 


图 9-9 平衡 二 叉 树 和 不 平衡 二 又 树 示例 
我 们 希望 由 任何 关键 字 序列 构成 的 二 叉 排 序 树 都 是 AVL 树 。 
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因为 AVL 树 上 任何 结 点 的 左右 子 树 的 深度 之 差 都 不 超过 1, 所 以 其 
平均 查找 长 度 和 logn 同 数量 级 。 

那么 ,如 何 使 构造 的 二 又 排序 树 为 平衡 二 叉 树 呢 ? 下 面 我 们 先 
看 一 个 具体 例 - 广 。 假设 表 中 关键 字 序 列 为 (15,27,33,94,68)。 显然 ， 
空 树 和 由 一 个 结 点 15 组 成 的 树 都 是 平衡 二 叉 树 。 在 插入 27 之 后 仍 
是 平衡 的 ,只 是 根 结 点 的 平衡 因子 bf 由 0 变 为 一 1。 在 继续 插入 33 
之 后 ,由 于 结 点 15 的 bf 值 由 一 1 变 成 一 2, 出 现 了 不 平衡 现象 ,此 时 ， 
可 以 对 树 作 一 个 逆 时 针 “ 旋 转 ”, 令 结 点 27 为 根 ,而 结 点 15 为 它 的 左 
子 树 ,如 图 9-10(d)~(e) 所 示 。 继续 插入 94 和 68 之 后 ,由 于 结 点 33 
的 bf 值 变 成 -2, 二 叉 排 序 树 中 又 出 现 了 新 的 不 平衡 现象 , 需 进行 调 
整 。 但 此 时 由 于 结 点 68 插 在 结 点 94 的 左 子 树 上 ,因此 不 能 如 上 作 简 
单调 整 。 对 于 以 结 点 33 为 根 的 子 树 来 说 , 既 要 保持 二 叉 排 序 树 的 特 
性 ,又 要 平衡 , 则 必须 以 结 点 68 作为 根 结 点 ,而 使 33 成 为 它 的 左 子 
树 的 根 ,94 成 为 它 的 右 子 树 的 根 。 这 好 比 对 树 作 二 次 “旋转 ”操作 
一 一 先 顺 时 针 旋 转 , 然 后 逆 时 针 旋 转 ,如 图 9-10(f) 一 (h) 所 示 : 
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(a) 空 树 (b) 插入 15 〈c) 插入 27  (d) 插入 33 (e) 道 时 针 旋 转 


({) 相继 插 和 人 94. 68 Cg) 顺 时 针 旋 转 (h)〉 逆 时 针 旋 转 


图 9-10 平衡 二 叉 树 的 生成 过 程 
一 般 情况 下 ,假设 由 于 在 平衡 二 叉 树 上 插入 结 点 而 失去 平衡 的 
最 小 子 树 的 根 结 点 指针 为 A( 即 A 是 离 插 入 结 点 最 近 , 晶 平衡 因子 
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绝对 值 超过 1 的 结 点 ), 则 失去 平衡 后 进行 调整 的 规律 可 归纳 为 下 列 
四 种 情况 : 

(1) LL 型 平衡 旋转 :由 于 在 A 的 左 孩 子 的 左 子 树 上 插入 结 操 ， 
而 使 A 的 平衡 因子 由 1 变 成 2 导致 二 又 树 失去 平衡 。 这 时 , 需 进 行 
一 次 顺 时 针 旋 转 操作 ,如 图 9-11(a) 所 示 。 

(2) RR 型 平衡 旋转 :由 于 在 A 的 右 孩 子 的 右 子 树 上 插入 结 点 ， 
而 使 A 的 平衡 因子 由 一 1 变 成 一 2 导致 二 叉 树 失去 平衡 。 这 时 , 需 进 
行 一 次 逆 时 针 旋 转 操作 ,如 图 9-11(b) 所 示 。 

(3) LR 型 平衡 旋转 :由 于 在 A 的 左 孩 子 的 右 子 树 上 插入 结 点 ， 
而 使 A 的 平衡 因子 由 1 变 成 2 导致 二 叉 树 失去 平衡 。 这 时 , 需 进 行 
二 次 旋转 ( 先 逆 时 针 , 后 顺 时 针 ), 如 图 9-11(c) 所 示 。 

(4) RL 型 平衡 旋转 :由 于 在 A 的 右 孩子 的 左 子 树 上 插入 结 点 ， 
而 使 A 的 平衡 因子 由 一 1 变 成 一 2 导致 二 叉 树 失去 平衡 这 时 , 需 进 
行 二 次 旋转 ( 先 顺 时 针 , 后 逆 时 针 ), 如 图 9-11(d) 所 示 。 

具体 的 平衡 算法 ,这 里 就 不 作 讨 论 了 ,读者 可 以 根据 上 述 四 种 情 
况 进行 考虑 。 
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前 面 介 绍 的 查找 方法 , 均 适 用 于 存储 在 计算 机 内 存 中 的 文件 或 
表 ,统称 为 内 查找 方法 。 若 要 查找 在 外 存储 器 (如 磁盘 ) 上 的 信息 时 ， 
则 要 用 外 查找 方法 。 在 此 介绍 的 B 树 就 是 其 中 之 一 。 
1970 年 BaYer 提出 了 一 种 多 又 平 衡 树 , 称 为 B 树 。 一 个 m 阶 的 
B 树 满足 下 述 条 件 : 
(1) 每 个 结 点 至 多 有 m 个 孩子 ; 
: (2) 除根 结 点 和 终端 结 点 (树叶 ) 之 外 ,每 个 结 点 至 少 有 [my/2j 
个 访 子 3 
(3) 根 结 点 至 少 有 两 个 孩子 (除非 它 本 身 又 是 树叶 ); 
(4) 具有 n 个 孩子 的 非 终端 结 点 含有 n 一 1 个 关键 字 ; 
(5) 所 有 的 终端 结 点 都 出 现在 同一 层 上 ,并 且 都 不 带 信息 。 
图 9-12 给 出 了 一 个 含有 j 个 关键 字 和 j 十 1 个 指针 的 B 树 结 点 。 
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图 9-11 二 叉 平衡 树 的 平衡 旋转 图 示 
该 结 点 中 的 关键 字 满 足下 列 条 件 : 
KK<…<Ki, 指 针 Pi 指向 一 个 子 树 的 根 , 该 子 树 中 所 有 结 
点 所 含 的 关键 字 均 大 于 Ki, 小 于 Ky,。 
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在 B 树 上 查找 的 过 
程 如 下 : 设 如 图 9-11 所 
示 的 结 点 P 已 从 外 存 读 
到 内 存 中 。 我 们 可 以 选择 人 
适当 的 内 查找 法 在 结 点 | z 
p 中 查 :车 j 比较 大 时 ,可 选用 折 半 查找 ; 若 ; 较 小 , 则 可 采用 顺序 查 
找 。 现 给 定 一 个 关键 字 x, 若 x 在 结 点 p 中 , 则 查找 成 功 ;否则 , 必 是 
下 述 三 种 情况 之 一 : 

(1) 攻 ;<x<K ,其 中 1 三 =i 过 j, 则 沿 指 针 Pi 继续 查 。 

(2) x 之 K,, 则 沿 指针 P; 继续 查 。 

(3) x<K,, 则 沿 指针 Po 继续 查 。 

如 果 在 某 种 情况 下 ,相应 指针 指向 终端 结 点 ( 即 叶 子 ), 则 查找 失 
败 ,说 明 关键 宁 x 不 在 该 B 树 中 。 

当 查 找 不 成 功 时 ,需要 进行 插入 。 显 然 ,每 次 插入 总 是 从 最 下 层 
的 非 终端 结 点 开始 的 。 对 于 一 棵 m 阶 的 了 B 树 , 若 在 一 个 不 满 m 一 1 
个 关键 字 的 结 点 中 插入 , 则 可 以 直接 进行 。 若 在 一 个 已 有 m 一 1 个 关 
键 字 的 结 点 中 进行 插入 , 则 要 将 该 结 点 “分 裂 "成 两 个 结 点 ,从 而 还 需 
对 它 的 上 层 结 点 进行 插入 。 现 举例 说 明 。 

图 9-13(a) 所 示 是 一 棵 5 阶 B 树 。 当 要 在 该 树 中 插入 关键 字 为 
36,37 的 记录 时 , 可 以 直接 插 在 结 点 p 中 。 然 后 , 当 继 续 要 求 插入 关 
键 字 35 时 ,由 于 p 结 点 已 满 , 则 要 将 它 “ 分 裂 ” 成 两 个 结 点 , 按 平均 分 
配 的 方式 将 关键 字 分 配给 这 两 个 结 点 。 这 时 需 将 35 插入 到 上 层 结 
点 中 , 因 上 层 结 点 已 填 满 , 故 再 次 形成 “分 裂 ”, 将 40 插入 到 更 上 一 层 
的 结 点 中 ,最 后 的 情况 如 图 9-13(b) 所 示 。 

从 上 例 可 以 看 出 ,在 B 树 中 插入 时 ,产生 结 点 “分 裂 ”* 是 由 下 层 
结 点 逐步 向 上 层 传递 的 ;在 极端 情况 下 ,会 一 直 传 递 至 根 结 点 。 实 际 
上 ,这 也 是 B 树 增高 的 唯一 途径 。 

若 要 在 BB 树 中 删除 关键 字 , 其 处 理 过 程 比 插 入 复杂 。 先 要 找到 
被 删 关键 字 K, 的 位 置 , 若 K; 在 最 下 层 的 非 终端 结 点 中 , 则 可 直接 删 
去 ;否则 , 当 删 去 K; 后 ,其 空 出 的 位 置 要 抽调 P; 所 指 子 树 中 的 最 小 
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CTE DEDEDE DA DGD 


(a) 插入 前 


~ 
(22 24)(26 27)(31 32)(36 37) 


(b) 依次 插入 36、37、35 后 


i , 


图 9-13 在 BB 树 中 插入 结 点 
关键 字 来 填补 (这 个 最 小 关键 字 一 定 在 最 下 层 的 一 个 非 终端 结 点 
中 )。 另 外 ,还 需 检查 当 结 点 中 关键 字 因 删除 .抽调 而 减少 后 ,是 否 还 
符合 B 树 的 定义 ; 若 不 符合 ,， 则 要 作 结 点 “合并 ”等 相应 的 处 理 。 


9.3 哈 希 表 查 找 


一 、 哈 希 表 


哈 希 表 的 查找 思想 与 前 面 介绍 的 查找 方法 完全 不 同 。 无 论 是 顺 
序 查 找 \ 折 半 查 找 还 是 二 叉 排 序 树 查找 ,都 要 通过 一 系列 的 关键 字 比 
较 才 能 确定 被 查 记录 在 表 中 的 位 置 ; 所 以 ,这 类 方法 统称 为 对 关键 字 
进行 比较 的 查找 方法 ,而 哈 希 法 却 是 利用 关键 字 进 行 转换 ,计算 出 记 
录 存 放 地 址 的 查找 方法 ， 

如 果 一 个 关键 字 对 应 一 个 地 址 ,这 就 是 最 直观 ,最 简单 的 哈 硕 
法 ;但 这 种 方法 往往 行 不 通 。 例 如 ,有 一 个 符号 表 其 标识 符 至 多 由 五 
个 字母 组 成 , 则 可 能 有 
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个 不 同 的 标识 符 , 也 就 是 说 可 能 有 这 人 么 多 个 不 同 的 关键 字 ; 如 朱 一 个 
关键 字 对 应 一 个 地 址 , 那 其 存储 空间 就 难以 满足 要 求 。 因 此 ,这 样 的 
一 一 对 应 关系 盟 然 简单 .方便 ,但 实用 价值 不 大 ;而 且 在 实际 问题 中 ， 
一 般 不 可 能 有 这 么 多 的 标识 符 同 时 出 现在 一 个 源 程 序 中 ,那么 ,是 盏 
可 以 设想 一 种 方法 , 既 能 利用 关键 字 直 接 找到 其 存储 位 置 , 又 不 致 于 
占用 太 多 的 存储 空间 而 达到 存储 符号 表 的 目的 ,显然 ,这 一 设想 将 导 
致 一 个 问题 , 即 由 于 希望 尽量 减少 存储 空间 ,所 以 会 造成 两 个 不 同 的 
关键 字 被 转换 匀 同 一 个 存储 地 址 上 去 ,此 时 叫做 发 生 冲 突 。 另 外 ,如 
何 利 用 关键 字 蛙 接 转 换 成 存储 地 址 呢 ? 这 需要 设计 一 个 函数 ,其 自 变 
量 是 关键 字 ,这 个 函数 称 为 Hash 函数 ,用 日 表示 。 该 函数 把 变化 范 
围 很 广 并 可 识 曾 的 关键 字 通 过 各 种 前 裁 手段 和 简单 的 数学 运算 , 转 
换 成 存储 地 址 (或 向 量 的 标号 ), 因 此 得 名 为 “杂凑 ”。 由 于 可 以 把 
Hash 函数 看 成 按照 某 种 特定 的 方法 将 记录 按 关 键 字 散 刻 到 内 存储 
器 的 指定 空间 本 ,所 以 这 种 方法 也 称 为 散 列 地 址 法 。 另 外 ,也 可 以 称 
为 关键 字 转 换 法 。 采 用 哈 希 法 在 连续 的 内 存 空间 中 建立 起 来 的 符号 
表 ,就 称 为 哈 希 表 。 

哈 希 法 可 以 这 样 来 描述 :对 于 关键 字 , 可 以 定义 一 个 简单 的 
Hash 函数 H(k), 使 得 HC) (或 用 H(k) 进 行 一 些 线性 运算 后 ) 等 于 
符号 表 存 区 内 某 一 单元 的 地 址 ;并 且 要 求 当 Ki 关 K; 时 ,H(K1) 一 日 
(K;) 的 可 能 性 尽量 地 小 。 

如 果 KK 关 Ks 而 HKi)= 二 H(K;) 就 是 发 生 了 冲突 .实际 上 冲突 是 
不 可 避免 的 ,所 以 只 要 求 发 生 冲 突 的 可 能 性 尽量 地 少 。 

办 此 ,对 3 了- 蛤 希 表 ,主要 研究 下 列 两 个 问题 : 

1， 如何 设 计 Hash 函数 ? 

2. 如 何 解决 冲突 ? 

二 、 构 造 哈 希 函 数 的 基本 方法 

假定 符号 表 的 存储 区 是 一 个 长 度 为 M 的 向 量 , 现 采用 Hash 法 

进行 存储 ， 所 荐 接收 的 不 同 关键 字 有 NN 个 ,但 不 知道 各 种 关键 字 出 


现 的 频率 是 多 少 。 这 时 应 如 何 构 造 Hash 图 数 呢 ? 
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构造 Hash 函数 的 方法 很 多 ,衡量 Hash 函数 好 坏 的 主要 标准 是 
尽 可 能 地 减少 冲突 。 要 减少 冲突 ,就 要 设法 使 哈 硕 函数 尽 可 能 均匀 地 
把 关键 字 映 射 到 符号 表 存 区 的 各 个 存储 地 址 上 ,这 样 可 以 提高 查找 
效率 。 在 构造 哈 希 函数 时 ,一 般 都 要 对 关键 字 进 行 计算 。 为 了 尽量 避 
免 产 生 相 同 的 哈 希 函数 值 , 所 以 应 使 关键 字 的 所 有 组 成 成 份 都 能 起 
作用 。 但 关键 字 的 组 成 是 难以 在 事前 全 部 确定 的 ,因此 ,很 难说 那 一 
种 哈 希 函数 是 最 好 的 。 

符号 表 中 各 关键 字 是 由 字母 组 成 的 ,在 不 同 的 计算 机 中 都 有 相 
应 的 内 部 表示 法 ,但 最 后 总 是 以 二 进 制 或 十 进 制 的 正 整 数 来 表示 。 例 
如 ,用 三 位 数学 的 整数 01 一 26 表示 对 应 的 26 个 英文 字母 , 则 下列 四 
个 关键 字 与 其 内 部 的 代码 关系 为 : 

关键 字 KEYA KEYB AKEY ~ BKEY 

内 部 代码 11052501 11052502 01110525 02110525 

现 以 这 四 个 关键 字 为 例 介 绍 几 种 常用 的 哈 希 负数 。 

1. 平方 取 中 法 

这 是 较 常 用 的 哈 希 函数 ,构造 原则 是 : 先 计算 出 关键 学 内 部 代码 
的 平方 值 , 再 取 它 的 中 间 几 位 作为 内 存 地 址 .对 上 面 给 出 的 四 个 关键 
字 ,其 结果 如 下 : 

关键 富 内 部 代码 内 部 代码 平方 值 。” 哈 希 函数 值 


人 YA 11052501 122157773355001 773 
上 KEYB 11052502 122157800460004 800 
AKEY 01110525 001233265775625 265 
BKEY 02110525 004454315775625 315 


其 哈 希 函数 是 取 平 方 值 的 中 间 三 位 。 如 果 符 号 表 的 存储 地 址 是 
0 一 999, 则 上 述 哈 希 函数 值 就 是 存储 地 址 .如 果 计 算出 的 哈 希 函 数值 
超过 或 不 到 存储 区 的 地 址 范围 , 则 需要 乘 一 个 比例 因子 ,把 哈 希 函数 
放大 或 缩小 ,使 其 落 到 符号 表 的 存储 区 地 址 范围 内 。 
2. 除 留 余数 法 
这 种 方法 是 用 模 (MOD) 运 算得 到 的 。 设 给 出 的 关键 字 为 上 , 存 
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储 区 单元 数 为 m， 则 用 一 个 小 于 m 的 质数 p 去 除 k, 得 到 余数 r, 即 : 
r=k MOD p 
如 有 果 工 落 在 存储 区 地 址 范围 内 , 则 +r 就 取 为 哈 希 函数 值 ; 和 否则 ,再 用 
一 个 线性 函数 求 出 哈 希 函数 值 。 例 如 :有 一 组 关键 字 从 000001 到 
859999 ,指定 的 存储 区 地 址 为 1000000 到 1005999, 即 m= 二 6000, 可 
选 p 一 5999 , 行 要 转换 关键 字 KK 二 172148, 则 有 : 
r 一 172148 MOD 5999 一 4716 
因 不 在 指定 的 地 址 范围 内 ,所 以 取 哈 希 函数 为 
H=1000000 十 r 
故 有 : 
H(k)-=H(172148)==1000000 十 172148 MOD 5999 一 1004176 
这 样 就 把 关键 字 k 直接 转换 成 存储 地 址 了 。 
在 此 ,p 的 选择 是 很 值得 研究 的 。 如 果 选 择 关 键 字 内 部 代码 的 基 
数 的 医 次 去 除 关 键 字 ,其 结果 必 是 关键 字 的 低位 数字 ,均匀 性 较 差 。 
如 果 取 p 为 任意 的 偶数 , 则 关键 字 内 部 代码 为 奇数 时 ,其 哈 希 函数 值 
为 奇数 .因此 , 选 p 为 偶数 也 不 好 。 理 论 分 析 和 试验 结果 均 证 明 ,p 应 
取 小 于 存储 区 容量 的 素数 。 例 如 对 前 述 的 四 个 关键 字 , 若 符号 表 存 区 
为 000 到 999, 应 取 p 为 小 于 1000 的 素数 ,可 取 p 王 997, 则 可 得 以 下 
结果 


关键 字 内 部 代码 H(k)=k MOD 997 
KEYA 11052501 756 
KEYB 11052502 757 

AKEY 01110525 864 

BKEY 02110525 873 


这 些 结果 是 比较 好 的 ,所 以 除 留 余 数 法 是 经 常 使 用 的 。 
3. 数字 分 析 法 
对 各 个 关键 字 内 部 代码 的 各 个 码 位 进行 分 析 : 第 i 位 上 , 各 个 关 
键 字 中 出 现 的 数码 种 类 比较 多 , 则 可 选中 该 值 为 哈 希 函数 值 的 一 部 
分 ; 需 选 多 少 位 来 组 成 哈 希 哺 数 值 应 视 存储 区 地 址 范围 而 定 。 例 如 ， 
需要 哈 希 函 数值 (地 址 码 ) 三 位 , 则 对 下 列 关 键 字 进行 数字 分 析 ,其 数 
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码 种 类 较 多 的 是 第 4.8、9 三 位 ， 取 这 三 位 构成 哈 希 函数 值 如 下 所 
示 ; 
关键 字 哈 希 函数 值 

000319426 326 

000718309 709 

000629443 643 

000758615 715 

000919697 997 

000310329 329 


这 种 方法 比较 简单 .直观 ,但 需要 预先 知道 每 个 关键 字 的 情况 ,这 就 
限制 了 它 的 应 用 范围 。 

构造 哈 硕 函数 的 方法 很 多 , 除 以 上 几 种 外 ,还 有 截 段 法 , 即 截取 
关键 字 中 的 某 一 段 数码 作为 哈 希 函数 ;分 段 迭 加 法 , 即 把 关键 字 的 机 
内 代码 分 成 几 段 再 进行 迭 加 (可 以 是 算术 加 ,也 可 以 是 按 位 加 ) 得 到 
哈 硕 图 数值 。 对 于 各 种 构造 哈 希 函 数 的 方法 ,很 难 一 概 而 论 地 评价 
优 劣 ;任何 一 种 哈 希 函数 都 应 当 用 实际 数据 去 测试 它 的 均匀 性 ,才能 
做 出 正确 判断 和 结论 。 


三 、 解决 冲 突 的 几 种 方法 


哈 希 法 中 不 可 避免 地 会 出 现 冲突 现象 ,所 以 应 用 哈 希 法 时 关键 
的 问题 是 如 何 解 决 冲突 ,解决 冲突 的 方法 基本 上 有 两 大 类 ;一 类 称 为 
开放 地 址 法 , 当 发 生 冲 突 时 ,用 某 种 方法 形成 一 个 探测 的 序列 , 沿 着 
这 个 序列 一 个 个 单元 地 查询 ,直到 找到 这 个 关键 字 的 记录 或 找到 一 
个 开放 的 地 址 ( 即 没有 进行 存储 的 空 单元 ) 。 此 时 ,如 果 是 插入 操作 ， 
则 遇 到 空 单元 就 可 以 进行 插入 ;如 果 是 查找 操作 , 则 遇 到 空 单元 就 是 
查找 失败 。 另 一 类 称 为 链 地 址 法 , 当 发 生 冲突 时 ,就 拉 出 一 条 链 , 建 立 
一 个 链接 方式 的 子 表 , 使 具有 相同 哈 希 函数 值 的 关键 字 及 其 记录 链 
接 在 同一 个 子 表 中 。 下 面 分 别 介绍 这 两 类 方法 的 具体 算法 。 

1. 开放 地 址 法 

用 开放 地 址 法 解决 冲突 时 ,要 产生 一 个 探测 序列 。 最 简单 的 产生 
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J 交 5 6 7 8 9 10 探测 序列 的 方法 是 进行 线 
顺序 地 到 存储 区 的 下 一 个 
单元 进行 探测 。 假 设 某 记 
录 的 关键 字 为 k, 哈 硕 函 数 
图 9-14 ”用 开放 地 址 法 处 理 冲 突 示例 “也 (k) 王 ], 奋 在 j 位 置 上 发 
生 冲 突 , 则 顺序 地 对 j 十 1 
位 置 进行 探测 .依次 类 推 . 例 如 ,在 长 度 为 11 的 哈 希 表 中 己 填 有 关键 
字 分 别 为 17.60、29 的 记录 ( 哈 希 函数 为 H(key) 二 key MOD 11) ,如 
图 9-14(a) 所 未 。 现 有 第 四 个 记录 需 插 入 ,其 关键 字 为 38, 由 哈 希 消 
数 得 到 其 哈 希 地 址 为 5, 产生 冲突 ; 若 用 线性 探测 再 散 列 的 方法 处 
理 ,得 到 下 一 个 地 址 6; 仍 冲突 ;再 求 下 一 个 地 址 7, 仍 冲突 ;直到 哈 硕 
地 址 为 8 的 位 置 为 *“ 空 ”时 ,处 理 冲 突 的 过 程 结束 ,记录 填 人 了 蛤 希 表 中 
序号 为 8 的 位 置 ,如 图 9-14(b) 所 示 。 
2. 链 地 址 法 
链 地 址 法 是 经 常 使 用 的 处 理 冲突 的 方法 ,此 方法 很 有 效 , 它 将 所 
有 了 哈 希 地 址 相同 的 记录 存储 在 一 个 线性 链表 中 。 假 设 某 哈 希 函数 产 
生 的 哈 希 地 址 在 区 间 f0..m 一 1] 上 , 则 设立 一 个 指针 型 向 量 。 
chainhash :ARRAY [0..m 一 1] OF pointer; 
使 其 每 个 分 量 chainhashlij] 指 向 哈 希 地 址 为 i 的 记录 链表 表 头 。 当 有 
哈 希 地 址 为 1 的 记录 插入 时 ,可 以 插 在 由 chainhash[ij 指 向 的 链表 表 
头 , 或 表 尾 ;也 可 以 插 在 中 间 , 以 保持 蛤 希 地 址 相同 的 记录 在 线性 链 
表 中 按 关键 字 值 有 序 ,例如 ,已 知 一 组 关键 字 为 (19,14,23,1,68,20， 
84,27,55,11,10,79), 则 按 哈 希 函数 H(key) 王 key MOD 13 和 链 地 
址 法 处 理 冲 突 所 得 到 的 哈 希 表 如 图 9-15 上 所 示 ,同一 链表 中 关键 字 目 
小 至 大 有 序 。 
3. 建立 一 个 公共 洲 出 区 
在 这 种 方法 中 ,用 两 个 表 存 储 记 录 .假设 哈 希 函数 的 值 域 为 [0.. 
m 一 -1 ], 则 设 向 量 hashtable[ 0. .m 一 1 为 基本 表 , 每 个 分 量 hashtable 
Li 存放 一 个 哈 硕 地 址 为 i 的 记录 ;已 设立 一 个 同 量 over[L0. .nj 为 海 
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图 9-15 链 地址 法 处 理 冲 突 时 的 哈 希 表 
出 表 , 它 用 于 在 储 哈 希 地 址 发 生 冲 突 的 记录 。 


四 、 哈 希 表 的 查找 


在 喻 希 表 上 进行 查找 的 过 程 同 哈 希 表 的 构造 过 程 基本 一 致 。 设 
给 定 值 为 k, 根 据 造 表 时 设 定 的 哈 希 函数 求 出 哈 希 地 址 , 若 表 中 此 位 
置 上 没有 记录 , 则 查找 不 成 功 ; 否 则 ,比较 关键 字 , 车 和 给 定 值 相等 ， 
则 查找 成 功 ;否则 说 明 发 生 冲 突 ,根据 造 表 时 设 定 的 处 理 冲 突 的 方法 
找 “ 下 一 地 址 ”, 直 至 哈 希 表 中 某 个 位 置 为 “ 空 ”( 查 找 不 成 功 ) ,或 者 此 
位 置 记录 的 关键 字 等 于 给 定 值 时 为 止 (查找 成 功 )。 
设 以 开放 地 址 法 处 理 冲 突 , 哈 希 函 数 以 hash 表示 , 则 哈 希 表 的 
查找 过 程 的 算法 框图 如 图 9-16 所 示 
假设 在 哈 希 表 中 , 当 某 一 位 置 上 的 key 域 值 为 零 时 ,表示 该 位 置 未 被 
占用 , 则 此 算法 的 PASCAL 语言 描述 如 下 ，; 
CONST 
mmax 一 { 哈 希 表 长 度 }; 
TYPE 
node = 二 RECORD 
key :integer; 
ch :char 
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END; 
hlistty= ARRAY [0..mmax—1]| OF node; 
FUNCTION hashsrch (shtable :hlistty ; k :integer) :integer; 
VAR 1,j:integer; 
BEGIN 
j:=hash(k); 1=]—1; 
WHILE (shtable[j]. key<>0) AND (<>) AND (shtable[j ]. key 
<>k) 


DO j:: :G+1) MOD mmax; 
IF shtable[j]. key=k 
THEN return (1) 
ELSE return(—1) 


END; 


判别 是 否 已 找 遍 整个 哈 希 表 , 当 
前 位 置 是 否 为 空白 以 及 是 否 不 冲突 
No 


线性 探测 , 找 下 一 位 置 
j: 二 (J 十 1) mod Nmax 


Yes 
5 有 ™ ， 


查找 成 功 ,返回 记录 位 置 


图 9-16 ” 哈 希 表 查找 算法 框图 


下 面 对 哈 希 法 进行 简单 的 分 析 。 
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哈 希 法 是 利用 关键 字 进 行 转换 计算 后 直接 求 出 存储 地 址 的 。 所 
以 当 由 哈 希 函数 能 得 到 均匀 的 地 址 分 布 时 ,不 需要 进行 比较 就 可 以 
直接 找到 所 查 的 记录 。 但 实际 上 ,冲突 不 可 能 完全 避免 冲突 ,因此 查 
找 时 还 需要 进行 探测 、 比 较 , 查 找 的 效率 显然 取决 于 发 生 ( 解 决 ) 冲 突 
的 次 数 。 如 果 我 们 引进 装填 因子 a: 

a 一 哈 希 表 中 的 记录 数 / 哈 希 表 的 长 度 

则 a 标志 了 哈 希 表 装 满 的 程度 。 直 观 地 看 ,a 越 小 ,发 生 冲 突 的 
可 能 性 就 越 小 ;a 越 大 , 即 表 中 记录 已 很 多 ,发 生 冲 突 的 可 能 性 就 越 
区 

D. E. kunth 在 “程序 设计 技巧 ”第 三 卷 中 指出 ;为 了 查找 一 个 记 
录 或 插入 一 个 新 的 记录 ,所 需要 的 探测 .比较 次 数 仅 依赖 于 装填 因子 
a。 对 于 线性 探测 法 ,查找 成 功 的 平均 查找 长 度 为 : (1 十 1/ (1 一 @))/2; 
查找 不 成 功 的 平均 查找 长 度 为 (1 十 1/(1 一 a)?)/2，。 

值得 提醒 大 家 的 是 , 若 要 在 非 链 地 址 处 理 冲 突 的 哈 希 表 中 删除 
一 个 记录 , 则 需 在 该 记录 的 位 置 上 填 和 一 个 特殊 符号 ,以 免 找 不 到 在 
它 之 后 插入 的 ,在 这 个 位 置 上 发 生 过 冲突 的 记录 。 


习 题 


1. 试 将 折 半 查找 的 算法 改写 成 递归 调用 形式 的 算法 。 

2. 试 从 空 树 开始 , 画 出 按 以 下 次 序 向 平衡 二 叉 树 插入 关键 字 
的 建树 过 程 : 8, 9, 10, 2, 1, 5, 3, 6, 4, 7, 11, 12。 

3,， 试 写 一 个 判别 给 定 二 叉 树 是 否 为 二 叉 排 序 树 的 算法 。 二 又 树 
以 二 叉 链表 作 存 储 结 构 , 且 树 中 结 点 的 关键 字 均 不 同 。 

4. 假设 哈 硕 表 的 长 为 m, 哈 希 函 数 为 HGx), 处 理 冲 突 的 用 链 地 
址 法 。 试 编写 输入 一 组 关键 字 并 构造 哈 希 表 的 算法 。 
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第 十 日 排 序 


在 使 用 计算 机 进行 数据 处 理 时 ,经 常 要 把 数据 按 一 定 的 规律 排 
列 起 来 。 设 有 - -组 记录 Ri,Ri,…,R,, 其 对 应 的 关键 字 为 Ki,K;,…， 
K,。 将 此 n 个 记录 按 其 关键 字 大 小 递增 (或 递减 ) 的 次 序 排 列 起 来 ， 
使 得 当 i 二 时 .Ki 二 二 (或 二 )K,;, 这 就 称 为 排序 (sorting)。 排 序 在 
计算 机 软件 中 习 用 十 分 广泛 ;有 时 候 排序 是 为 了 提高 查找 的 速度 , 例 
如 , 折 半 查找 的 前 提 就 是 记录 按 关键 字 必 须 有 序 , 有 时 候 排序 是 系统 
管理 上 的 需要 ”因此 ,为 了 提高 计算 机 的 工作 效率 ,需要 研究 有 效 的 
排序 方法 。 

排序 的 方法 很 多 ,根据 记录 所 处 的 位 置 , 可 以 分 为 内 部 排序 和 外 
部 排序 两 大 类 .内 部 排序 是 指 排序 期 间 , 全 部 数据 都 放 在 内 存 中 进行 
的 排序 ;外 部 排序 是 指 当 需要 排序 的 记录 非常 之 多 ,排序 时 全 部 记录 
已 不 能 同时 存 人 内 存 中 ,所 以 排序 期 间 ,不仅 要 使 用 内 存 , 而 且 还 需 
使 用 外 部 存储 器 的 排序 。 本 日 主要 讨论 内 部 排序 的 一 些 常用 方法 。 某 
些 内 部 排序 方法 的 思想 是 可 以 推广 到 外 部 排序 的 。 

在 本 日 讨论 中 ,排序 均 以 关键 字 从 小 到 大 的 次 序 来 进行 。 如 果 待 
排序 的 记录 中 ,存在 关键 字 相 等 的 记录 , 当 经 过 排序 后 ,这 些 关 键 字 
相等 的 记录 之 间 , 相 对 次 序 保持 不 变 , 则 称 这 种 排序 方法 是 稳定 的 ， 
否则 称 为 不 稳定 的 。 例 如 ,有 一 组 无 序 的 关键 字 为 :Ki、K;、K;、K、 
K, ,其 中 K; 王 Ki。 若 排序 后 ,得 到 的 有 序 序 列 为 :KKs .KK Ki， 
因为 Ks 还 是 在 Ks 前 面 , 所 以 这 种 排序 方法 是 稳定 的 ; 若 得 到 有 序 
序列 为 :K;,K;,Ki,K;,Ki, 则 改变 了 Ks 和; 的 相对 次 序 , 岳 以 这 种 
排序 方法 是 不 稳定 的 。 

在 下 面 介绍 的 排序 方法 中 ,所 用 例子 的 数据 都 是 指 记录 的 关键 
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字 ; 对 关键 字 所 施行 的 操作 均 是 针对 其 相应 的 记录 而 言 的 ， 
10.1 插入 排序 


在 本 节 中 将 介绍 直接 插入 排序 及 其 改进 的 方法 一 一 希 尔 排 序 。 
一 、 插 入 排序 


插入 排序 的 基本 思想 是 把 一 个 个 记录 按 其 关键 字 的 大 小 插入 到 
已 经 排 好 次 序 的 记录 序列 之 中 ,使 得 插 和 人 后 的 记录 序列 仍然 是 有 序 
的 ,这 很 象 在 坯 扑克 牌 时 ,一 边 抓 牌 ,一 边 理 牌 的 过 程 , 抓 了 一 - 张 牌 就 
插 到 其 应 有 的 位 置 上 去 。 
例如 ,已 知 待 排序 的 一 组 记录 关键 字 的 初始 序列 如 下 所 示 ， 
{49,38,65,97,76,13,27,49)} / 
直接 插入 排序 一 开始 ,把 第 -个 记录 看 成 一 个 有 序 序列 [49], 然 后 把 
第 2 个 记录 按 关键 字 的 大 小 播 人 到 这 个 有 序 序列 中 ,成 为 -个 新 的 
有 序 序列 L38,49]。 依 次 类 推 ,一般 情 况 下 ,第 i 趟 直接 插入 排序 的 操 
作为 :在 含有 i 一 1 个 记录 的 有 序 子 序列 r[1..i 一 1] 中 插入 记录 rr] 
后 ,组 成 一 个 含有 i 个 记录 的 有 序 子 序列 r[1.. 果 。 在 r[1..i 一 1 中 为 
rLij 寻 找 播 入 位 置 的 过 程 可 以 用 顺序 查找 ,从 第 i 一 1 位 置 开 始 进行 ， 
并 且 在 rL0j] 设 置 监视 哨 。 图 10-1 为 直接 插入 排序 算法 的 框图 描述 。 
其 PASCAL 语言 描述 如 下 : 
CONST nmax 一 {最 多 记录 数 }; 
TYPE node= RECODE 
key :integer ; 
data :char; 
END; 
listtype 王 ARRAYL0. .nmax | OF node; 
PROCEDURE straisort (VAR r:listtype,n :integer); 
VAR 1,],k:integer; 
BEGIN 
FOR 1:=2 TO n DO 
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组 织 循环 :(1: 一 2) 


设立 监视 哨 (rL0] : =r[1]) 
从 j 位 置 开 始 查找 插 人 位 置 (j] : = 二 1 一 1) 


插入 记录 的 关键 字 K 同 ] 
位 置 记录 的 关键 字 比 较 


k > 一 5[j]. key 
把 记录 播 人 到 j 士 1 
的 位 置 且 修改 1 

(i: 一 i 十 1) 


10-1 直接 插入 排序 算法 框图 
BEGIN 
k:=r[i]. key; rL[0]: =rLij; 
j:=1—1; 
WHILE k<r[)]. key DO 
BEGIN 
r[j+1j]:=r[Djj; 
je} 
END; 
r[j 十 1]: 王 rL0] 
END 
END:; 
对 上 述 例子 ,按照 此 算法 进行 直接 插入 排序 的 过 程 如 下 : 


r[o] rf1] xzr[2] xzr[3] rf4] r[5] xzr[6] r[7] rl8] 
初始 [49] 38 65 97 76 13 27 49 
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38 [38 49] 65 97 76 13 27 49 
65 [38 49 65] 97 76 13 27 4 
97 [38 49 65 97] 76 13 27 49 
[38 49 65 76 97] 13 27 49 
13 [13 38 49 65 76 97] 27 49 
27 [Tig ‘27 38 49 65 76 97] 49 
49 [13 27 38 49 49 65 76 97] 


其 中 ,49 是 为 了 区 分 前 后 两 个 不 同 的 记录 ,它们 的 关键 字 均 为 49。 

分 析 上 述 算法 ,为 了 正确 地 插入 第 i 个 记录 ,最 多 要 比较 i 次 ,最 
少 比较 一 次 ,平均 比较 (i 十 1)/2 次 。 如 果 按 平均 比较 次 数 计算 , 则 将 
n 个 记录 进行 放 接 插入 排序 所 需 的 平均 比较 次 数 为 : 


[os om pm [oe pa 一 

上 二 

OO ~ [ea ol HH CO [Oe 
=~] 
Cn 


jj 


2 G 十 1D)/2 一 人 o? 十 tn 一 人 [4sen2/4 

插入 排序 中 记录 的 移动 次 数 也 是 比较 多 的 。 为 了 插入 第 i 个 记录 , 需 
移动 记录 最 多 为 i 十 1 次 ,最 少 为 2 次 (包括 建立 监视 哨 记录 ); 所 需 
总 的 平均 移动 次 数 近 似 为 nz/4。 

如 果 将 直接 插入 排序 中 为 记录 查找 插入 位 置 的 方法 改 为 折 半 查 
找 , 则 可 以 减少 比较 次 数 ,这 样 的 排序 方法 称 为 折 半 插入 排序 ;但 不 
论 是 直接 插入 还 是 折 半 插入 排序 ,记录 的 移动 次 数 都 是 很 大 的 。 如 果 
将 存储 结构 由 回 量 改 为 链表 ,再 进行 插入 排序 ,就 可 以 不 移动 记录 ， 
这 种 方法 称 为 链表 插入 排序 。 这 几 种 插入 排序 方法 都 是 稳定 的 。 


二 、 和 希 尔 排序 


希 尔 排 序 又 称 " 缩 小 增 量 排序 ", 它 属于 插入 排序 的 一 种 ,是 对 直 
接 插 和 排序 方 法 的 改进 。 

从 对 直接 插入 排序 的 分 析 得 知 ,其 算法 的 平均 时 间 复 杂 度 为 
On )。 但 是 ， 当 待 排序 记录 序列 按 关 键 字 为 正 序 "时 ,其 时 间 复 杂 
度 可 降低 到 On) 。 由 此 可 设想 , 当 竺 排序 记录 序列 按 关键 字 基本 有 
序 ? 时 ,直接 插入 排序 的 效率 就 可 大 大 提高 ;从 另 一 方面 来 看 ,直接 播 
人 排序 算法 简单 ,并 且 在 n 值 很 小 时 效率 也 比较 高 。 硕 尔 排序 正 是 从 
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这 两 点 分 析 沁 发 对 直接 插 人 排序 进行 改进 而 得 到 的 -- 种 插入 排序 方 
法 。 其 算法 思想 是 : 选 定 一 个 记录 的 间隔 数 d, 把 全 部 记录 按 此 间隔 
数 从 第 一 个 记录 起 进行 分 组 ,所 有 相隔 为 4 的 记录 作为 一 组 ,在 各 组 
内 进行 排序 ;然后 减 小 间隔 数 , 重 新 分 组 ,再 进行 组 内 排序 。 如 此 重 
复 ,直到 间隔 数 为 1。 各 组 的 组 内 排序 可 以 用 直接 择 人 排序 ,也 可 以 
用 其 它 的 排序 方法 。 

对 间隔 的 选取 ,有 多 种 方法 。 希 尔 提 出 的 取 法 是 : 

di==n DIV 2 di 一 dDIV 2 

克 努 特 (Kunth) 提 出 取 di=dy/3。 另 外 ,有 的 人 认为 d 取 奇数 好 ,有 
的 人 则 认为 diGi=1、2、…) 之 间 互 素 好 等 等 :不管 如 何 取 ,必须 不 断 
缩小 ,最 后 为 1。 下 面 我 们 按 希 尔 的 方法 举例 说 明 ， 

初始 关键 他 46 55 20 42 94 17 17 70 


[| 


di 一 4 


| 


第 一 趟 结果 46 17 17 42 94 55 20 70 
= PE 
EM 
第 二 趟 结果 17 17 20 42 46 55 94 70 
ds 二 4 
结果 17 17 20 42 46 55 70 94 
从 上 述 排序 过 程 可 见 , 希 尔 排 序 的 一 个 特点 是 子 序列 的 构成 不 
是 简单 地 “ 逐 段 分 割 ”, 而 是 将 相隔 某 个 “ 增 量 d” 的 记录 组 成 一 个 子 
序列 .显然 , 当 d 较 大 时 ,各 个 子 序列 的 元 素 较 少 , 使 用 一 些 简单 的 排 
序 方法 (如 直接 插入 排序 方法 ) 效 率 也 较 好 ; 当 d 较 小 时 ,由 于 许多 记 
录 已 经 有 序 , 不 需要 多 少 移动 ， 所 以 就 提高 了 排序 的 速度 , 当 最 后 d 
取 1 时 , 即 对 整个 序列 排序 。 图 10-2 为 描述 这 一 算法 的 框图 。 
其 PASCAL 语言 描述 如 下 : 
CONST nmax 一 {最 多 记录 数 }; 
dn=nmax DIV 2; 
PROCEDURE shellsort (VAR r:ARRAY[—dn..nmax| OF node; n: 
。202 。 


对 间距 d 赋 初 值 (d: 王 n) 
间 星 为 1 吗 ? 


YNo 
缩小 间 虐 (d: 一 dDiv2) | 


| 


设立 这 趟 排序 的 监视 哨 指针 S， 
S 首 先 指向 第 一 个 子 序列 的 监 
视 哨 位 置 (CS: 一 一 4 十 1) 


初始 化 这 趟 排序 中 ,插入 记录 
的 指针 i,i 首 先 指向 第 一 个 序列 
的 第 2 个 记录 (i 一 d 十 1) 


按 直接 插入 方法 ,把 ;所 指 
记录 插入 到 所 在 序列 的 恰 
当 位 置 


修改 监视 哨 指 针 S, 使 其 指向 
下 一 个 子 序列 的 监视 哨 位 置 


| 修改 iCi; 一 i 十 1) ] 


图 10-2 布尔 排序 算法 框图 


integer ) ; 
VAR d,s,i,j,k:integer; 
BEGIN 
:nN; 
WHILE d>>1 DO 
BEGIN 
d:=d DIV 2 


s: 二 一 d 十 1; 
FOR i;=d 二 1 TO n DO 
BEGIN 
rfs}:;=r[i]; j:=i—d; k;=r[i]. key; 
WHILE k<r[j]. key DO 
BEGIN 
r[j+d]:=rLj]; ] :一 ] 一 d 
END; 
rDj+d]:=r[s}j; 
sS: 一 S 十 1]; 
IF s>0 THEN s: 王 一 4 十 1 
END 
END 
END:; | 
名 尔 排序 的 速度 一 般 要 比 直接 插入 排序 快 ,但 具体 分 析 比 较 复 
琳 , 因 为 它 的 时 间 是 所 取 “ 增 量 ” 的 函数 .项 尔 排序 的 平均 比较 次 数 和 
平均 移动 次 数 都 约 为 n" ,有 兴趣 的 读者 可 以 参阅 Kunth 所 著 的 “ 程 
序 设计 技巧 "第 三 卷 。 硕 尔 排序 是 不 稳定 的 。 


10.2 交换 排序 


本 节 中 首先 介绍 基本 的 交换 排序 即 冒 泡 排序 ,然后 介绍 快速 排 
序 。 


一 、 冒 泡 排序 


冒 泡 排序 方法 是 把 记录 按 纵向 排列 ,然后 自 下 而 上 地 比较 相 邻 
记录 的 关键 字 Ki 和 Ji,, 若 Ki-:>Ki 称 为 逆序 , 则 两 者 交换 位 置 。 青 
将 Ki 1 与 Kj;-: 进 行 比较 ,如 有 逆序 则 交换 。 直 至 全 部 关键 字 均 比较 一 
遍 。 这 样 一 趟 加 工 就 使 关键 字 最 小 的 记录 上 升 到 第 一 个 位 置 。 然 后 
进行 第 二 趟 冒 泡 排序 ,对 后 n 一 1 个 记录 进行 同样 操作 ,其 结果 使 关 
键 字 次 小 的 记录 被 安置 在 第 二 个 位 置 上 。 依 次 类 推 , 设 有 nm 个 记录 ， 
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则 最 多 经 过 n--1 趟 排序 后 ,就 使 记录 按 关键 字 从 小 到 大 、 自 上 而 下 
地 排 好 .这 个 过 程 就 象 气泡 一 个 个 往 上 冒 一 样 , 故 形象 地 取 名 为 冒 泡 
排序。 
例如 ,有 8 个 记录 ,其 冒 泡 排序 过 程 如 下 : 

3 13 13 13 有 13 二 过 

49 “ 广 - 一 27 27 Zi 27 27 27 


后 后 后 后 后 后 后 


在 这 个 例子 中 ,最 后 五 趋 排序 是 多 余 的 ,因为 ,此 时 记录 按 关键 
字 已 排 好 序 。 所 以 ,在 算法 中 应 记 住 每 一 趟 排序 时 ,是 否 发 生 过 交 
换 ”, 若 没有 发 生 过 交换 则 说 明 己 排 好 序 , 整个 排序 结束 。 图 10-3 为 
冒 泡 排序 算法 的 框图 描述 。 

这 个 算法 的 PASCAL 语言 描述 ,读者 可 根据 图 10-3 所 示 框 图 
自己 完成 。 

从 冒 泡 排 序 过 程 容易 看 出 ,当初 始 序 列 为 “ 正 序 ” 时 , 则 只 需 进行 
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(1<n)AND change? 
Yes 


r[j 间 rLj 一 1j 交 换 且 修改 
交换 标志 :change:=truc 


修改 ](; 一] 一 1) 


图 10-3 冒 泡 排序 算法 框图 
一 趋 排序 ,在 排序 过 程 中 只 需 进行 n 一 1 次 关键 字 之 间 的 比较 , 且 不 
需 移动 记录 ;反之 , 若 初 始 序 列 为 “逆序 ?序列 , 则 需 进 行 n 一 1 趟 排 
序 , 共 需 进 行 n(n 一 1)/2 次 关键 字 比 较 以 及 等 数量 级 的 记录 交换 。 因 
此 总 的 时 间 复 集 度 为 O(n?)。 冒 泡 排 序 是 一 种 稳定 的 排序 方法 。 


二 、 快速 排序 


这 种 排序 方法 是 由 霍 尔 (Hoare) 提 出 的 。 这 是 目前 内 部 排序 中 速 

度 较 快 的 方法 . 故 称快 速 排序 ,其 实质 是 分 区 交换 排序 。 在 这 种 排序 

方法 中 ,用 一 个 向 量 存储 n 个 记录 , 先 取 向 量 中 第 一 个 记录 作为 控制 

记录 ,设法 把 该 记录 放 到 向 量 的 合适 位 置 上 ,使 得 在 这 个 记录 右面 的 

所 有 记录 的 关键 字 均 大 于 等 于 它 的 关键 字 , 而 在 它 左 面 的 那些 记录 
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的 关键 字 都 小 于 它 的 关键 字 , 这 样 就 把 序列 分 成 了 两 个 子 序 列 , 此 过 
程 称 为 一 趟 快速 排序 。 然 后 再 分 别 对 这 两 个 子 序列 进行 一 趟 快速 排 
序 。 依 此 类 推 ,直至 排序 完成 为 止 。 

那么 怎样 才能 把 控制 记录 放 到 其 合适 的 位 置 上 呢 ? 假设 待 排序 
的 序列 为 {rEs],r[s 十 1j,…,r[t]) ,我 们 可 以 设立 两 个 位 置 指针 1 和 
j, 开 始 时 , 令 i=s,j 二 t。 首 先 取 控制 记录 x(x: 二 rLsj]) ,然后 :从 j 所 
指 的 位 置 起 向 前 搜索 ,找到 第 一 个 关键 字 小 于 控制 记录 关键 字 的 记 
录 ,将 它 同 探测 记录 x 交换 位 置 ;@ 从 1 革 所 指 的 位 置 起 加 后 搜索 , 找 
到 第 一 个 关键 字 大 于 控制 记录 关键 字 的 记录 ,将 它 同 控制 记录 x 区 
换 位 置 .重复 上 述 两 步 操 作 ,直到 i=j, 则 1 所 指示 的 位 置 就 是 控制 记 
录 应 在 的 位 置 。 

例如 ,有 -组 记录 的 关键 字 , 其 一 趟 快速 排序 的 过 程 如 下 所 示 : 


6 .Bo He dE Yt 8 LY 0 46 送 x,70>x, 修 改 j 
i fj 
() 55 13 42 94 05 17 [70j 17<x, 移 动 17 ,修改 ; 
让 个 j 
[17] 55 13 42 94 05 OO [70] 55>>x, 移 动 55, 修 改 ] 
i ^j 
Fi79 -C0 3 dA2. 94 05 [E55 .70 05<<x ,移动 05, 修 改 i 
i 人 人 
Fl17 05] 13 42 94 (人 [55 70] 13 过 x ,修改 i 
i 人 
[17 05 13] 42 94 和 〇 [55 70] 42<<x, 修 改 j 
3 
[17 05 :3 42] 94 人 [55 70] 94 室 x, 移 动 94, 修 改 ] 
ET 人 水 
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[147 .05° 3 .42 GY. [9 55 770] i 一 j,x 送 i 位 置 
和 
[17 05 13 42] 46 [94 55 70] 
在 第 一 个 记录 找到 合适 位 置 后 ,就 把 整个 序列 分 成 了 左右 两 部 
分 ;再 在 这 两 部 分 上 分 别 重 复 上 述 操作 。 结 合 上 述 例子 ,其 分 区 进行 
排序 的 过 程 如 王 所 示人 方 括号 内 为 待 排序 关键 字 ): 
[17 05 13 42] 46 [94 55 70] 
i i 
[1305] 17 [42] 46 [94 55 70] 
i 
05 13 17 42 46 [94 55 70] 
和 人 
05 13 17 42 46 [70 55] 94 
5 
05 13 17 42 46 55 70 94 
现在 我 们 讨论 快速 排序 算法 的 具体 实现 ,首先 讨论 一 趟 快速 排 
序 算法 。 假 设 进行 一 趟 快速 排序 的 记录 区 间 的 下 界 和 上 界 分 别 为 s 
和 t, 则 算法 的 框图 描述 如 图 10-4 所 示 。 
其 PASCAL 语言 描述 如 下 : 
PROCEDURE qkpass(VAR r:listtype; s,t:integer; VAR i:integer); 


VAR Jj:integer; 
x :node; 
BEGIN 
i:=s; j:=t; x:;=rLs|; 
WHILE (<]) DO 
BEGIN 
WHILE (<j) AND (rLj]. key> =x. key) 
DO j:=j—1; 
rli]:=rLi]; 
WHILE (<j) AND (Cr[i]. key<=x. key) 
DO i1:=i+1:; 
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rLj]:=r[i] 
END:; 
r[i|:=x 
END; 


存放 区 间 中 第 一 个 记录 到 x 中 ， 
并 置 指 针 ij 


把 x 中 的 记录 存 入 
i 或 所 指 位 置 


ee 
把 ] 所 指 记录 存 人 i 所 指 位 置 
Cr[ij:=rLjJ) 


(1<DAND(G[i). key<=x. key 


修改 1GQ: 二 1 十 1) 


把 ij 所 指 记 录 存 人 j 所 指 位 置 
《rD] :一 zx ) 


图 10-4 一 趟 快速 排序 算法 框图 
整个 快速 排序 可 以 写成 递归 算法 ,其 框图 描述 如 图 10-5 所 示 ， 
假设 待 排序 的 记录 区 间 的 下 界 和 上 界 仍 以 s 和 + 表示 。 
其 PASCAL 语言 描述 如 下 : 
PROCEDURE aksdriC VAR r:listtype; s,t:integer); 
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VAR k:integer; 


( 开始 ) 
| BEGIN 
< 有 No . IF s<t THEN 
Yes BEGIN 
调用 一 趋 快速 排序 过 程 ,对 qkpass(r,s,t ,k); 
r[s. .t] 进 行 一 趟 排序 ,并 返 
回 rfs] 所 在 位 洛 k qksort (r,s,k—1); 
! | dksort(Gr,k 十 1,t) 
递归 调用 ,对 rs. .k 一 1] 进 END 
行 快速 排序 END; 


快速 排序 的 执行 时 间 在 待 排 

ba | 序 的 记录 按 关键 字 已 经 有 序 的 情 

况 下 为 最 长 。 这 时 ,第 一 趟 排序 经 

CC 孕 东 ) 过 n 一 1 次 比较 后 ,将 第 一 个 记录 

仍 定 在 它 原 来 的 位 置 上 ,并 得 到 

图 10-5 快速 排序 的 递归 算法 框图 一 个 有 n 一 1 个 记录 的 子 序列 ;第 

二 趟 排序 ,经 过 n 一 2 次 比较 ,将 第 二 个 记录 仍 定 在 它 原 来 的 位 置 上 ， 

并 得 到 一 个 有 n 一 2 个 记录 的 子 序 列 。 依 次 类 推 , 最 后 ,总 的 比较 次 数 
为 (n 一 1) 十 (nn 一 2) 十 … 十 1 二 n(n 一 1)/2, 记 为 O(n?)。 

另 一 种 特殊 情况 是 每 趟 排序 后 控制 记录 的 位 置 正好 确定 在 序列 

的 中 央 , 从 而 把 序列 分 成 大 小 相等 的 两 个 子 序列 ,其 总 的 比较 次 数 

为 


Tn)==n 二 +2T(n/2) 
=2n 十 4T(n/4) 
二 二 3n 十 8T(n/8) 


到 一 (logn)n 十 nT(1) 
记 为 OCnlog:n), 这 是 最 好 情况 。 可 以 证 明 , 其 平均 比较 次 数 也 是 
O 〇 (nlogzn) 。 快 速 排序 是 一 种 不 稳定 的 排序 方法 。 
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10.3 选择 排序 


本 节 将 介绍 直接 选择 排序 及 其 改进 的 方法 : 堆 排序 。 


一 、 直 接 选择 排序 


直接 选择 排序 的 方法 是 首先 在 所 有 的 记录 中 选 出 关键 字 最 小 的 
记录 ,将 它 与 第 一 个 记录 交换 存储 位 置 ;然后 再 在 余下 的 记录 中 选 出 
关键 字 次 小 的 记录 ,将 它 同 第 二 个 记录 交换 存储 位 置 。 依 次 类 推 , 直 
至 选 出 所 有 的 记录 ,使 整个 序列 成 为 有 序 序列 ,下 面 给 出 按 上 述 思 想 


进行 排序 的 例子 : 
初始 状态 49 38 65 49 52 13 27 78 
| S| 
第 一 趟 结果 [13] 38 65 49 52 49 27 78 
全 一 
第 二 未 结果 [13 27] 65 49 52 49 38 78 
区 一 一 
第 三 趟 结果 [13 27 38] 49 52 49 65 78 
第 四 趟 结果 [13 27 38 49] 52 49 65 78 
LL | 
第 五 趟 结 [13 27 38 49 49] 52 65 
第 六 趟 结果 [13 27 38 49 49 52] 65 78 
第 七 趟 结 [13 27 38 49 49 52 65] 78 
直接 选择 排序 算法 只 要 组 织 一 个 双 循 环 ,描述 此 算法 的 框图 见 
图 10-6 。 
其 PASCAL 语言 描述 如 下 。 
CONST 
max 二 {记录 的 最 多 个 数 }; 
TYPE 


node= RECORD 
key :integer; 
data :Integer 
END; 


78 


“让 


sfe 王 ARRAY [1..max| OF node; 


PROCEDURE slsort(VAR r:sre; n: 


integer); 
VAR 
| 1,j,k :integer; 
xX:node; 
BEGIN 
FOR j:=1 TO n 一 1 DO 

组 织 循环 .在 第 ! 到 第 n 
个 记录 中 选 出 具有 最 小 BE 
关键 字 的 记录 x k :一 j; 


将 x 与 第 i 位置 记录 交换 


FOR i:=j]+1 TO n DO 
IF r[k |].key>rLil]. key 


| 1 ; THEN k:=i; 
IF k=<>} THEN 
BEGIN 
r[k]:=rLj]; 
r[Lj] :一 x 
图 10-6 直接 选择 排序 Ns 
算法 的 框图 Na 
END:; 


直接 选择 排序 的 比较 次 数 与 记录 的 初始 排列 状态 没有 关系 。 第 
一 趟 找 出 最 小 关键 字 需 n 一 1 次 比较 ; 第 二 趟 找 出 次 小 关键 字 需 n 一 
2 次 比较 ; 依次 类 推 。 其 总 的 比较 次 数 为 : 

2 ni) =n(n—1)/2~n/2 

由 于 每 趟 选择 后 ,要 执行 两 个 记录 的 位 置 交 换 , 而 这 种 交换 需要 
用 一 个 暂 存 空间 ,所 以 一 次 交换 实际 要 进行 三 次 记录 的 移动 操作 。 上 
述 算法 的 外 循环 次 数 是 n 一 1 次 ， 所 以 物理 上 移动 记录 的 最 多 次 数 
为 3(n 一 1) 之 3n。 直 接 选 择 排序 的 主要 操作 是 记录 间 关 键 字 的 比 
较 , 所 以 其 总 的 时 间 复 杂 度 为 On?) 。 直接 选择 排序 是 一 种 不 稳定 的 


排序 方法 。 
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二 、 堆 排序 


堆 排 序 (heap sort) 是 对 直接 选择 排序 法 的 改进 。 在 讨论 堆 排 序 
之 前 先 介绍 一 下 树 形 选择 排序 。 

设 有 一 组 关键 字 为 {46,55,13,52,94,17,05,70)。 通 过 对 关键 字 
的 两 两 分 组 比较 可 以 形成 一 棵 二 叉 树 , 见 图 10-7(a)。 从 图 中 可 以 看 
出 ,对 n 个 记录 需 进行 n 一 1 次 比较 才能 选 出 一 个 关键 字 最 小 的 记 
录 ,在 图 10-7(a) 中 是 经 过 7 次 比较 后 才 选 出 05 的 ,接着 在 选 关 键 字 
次 小 的 记录 时 就 不 必 再 进行 n 一 2 次 比较 了 。 因 为 根 的 右 子 树 中 的 
05 已 经 选 出 , 它 的 叶子 位 置 可 用 cc 来 代替 ,再 在 右 子 树 中 进行 两 次 
比较 选 出 17, 上 最 后 根 的 左 、 右 孩子 比较 选 出 次 小 关键 字 为 13 的 记 
录 , 如 图 10-7(b) 所 示 。 其 间 一 共 只 进行 了 三 次 比较 , 即 70 与 cc 比 得 
70,70 与 17 比 得 17,17 与 13 比 得 13。 以 此 方法 逐步 进行 下 去 ,直至 
全 部 排序 结束 。 这 种 方法 虽然 减少 了 比较 次 数 ,但 需要 保留 许多 指 
针 。 另 外 ,对 mn 个 记录 需要 2n 一 1 个 存储 单元 。 


(b) 选 出 次 小 关键 字 为 13 的 记录 


10-7 树 形 选择 排序 
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为 了 殉 服 树 形 选 择 排 序 的 缺点 , 威 姆 洛斯 (]. Wiloms) 和 弗 洛 伊 
德 (Floyd) 在 1964 年 提出 了 一 种 改进 方法 称 为 堆 排序 。 
堆 的 定义 为 :对 于 一 个 关键 字 序 列 Ki ,K,,…,K,, 当 满足 如 下 条 
件 时 就 称 此 序 人 询 为 堆 :对 一 切 i, 1<=i<=Ln/2j， 
Bos 有 Ba 
K;< = Ky K.;>>=K;ri 
我 们 可 以 借助 完全 二 叉 树 来 描述 堆 。 如 果 一 棵 完全 二 叉 树 中 ,所 
有 结 点 的 值 均 不 大 于 (或 不 小 于 ) 其 左右 孩子 的 值 , 则 对 该 二 叉 树 按 
层次 进行 遍历 时 得 到 的 结 点 序列 就 是 一 个 堆 , 在 图 10-8 中 给 出 了 两 
棵 完全 二 叉 树 ”其 中 ,图 10-8(a) 所 示 的 是 一 个 堆 , 对 此 二 叉 树 按 层 
次 遍历 的 结果 为 :05,13,26,20,22,35; 而 图 10-8(b) 所 示 就 不 是 一 
个 堆 , 按 层次 遍历 该 二 叉 树 的 结果 为 :05,13,03,20,22,11,12。 
从 图 10-8(a) 可 以 看 出 , 根 结 点 记录 的 关键 字 就 是 最 小 关键 字 。 
将 其 输出 后 ,重新 建 堆 则 可 以 得 到 次 小 关键 字 。 依 次 类 推 , 则 在 堆 的 
定义 下 , 树 形 选择 排序 就 转化 为 堆 排 序 了 。 在 示例 中 虽然 按 树 形 来 图 
示 , 但 实际 存储 时 是 没有 指针 的 ,这 些 记录 被 存储 在 一 个 向 量 中 。 


(5) © 
出 29 © © 
四 (2 (83 BOO 
(a) 堆 (b) 不 是 堆 


图 10-8 用 完全 二 叉 树 描述 堆 

堆 是 怎样 建立 起 来 的 呢 ? 可 采用 所 谓 的 筛选 法 。 

在 n 个 记录 所 对 应 的 完全 二 叉 树 中 ,编号 为 Ln/2j,…,n 的 结 点 
都 是 叶子 ,已 满足 堆 的 定义 ;所 以 筛选 法 可 以 从 编号 为 ij=L2/nj] 开 
始 ; 使 这 棵 二 又 树 中 满足 堆 定义 的 结 点 的 范围 [Li. .nj 不断 扩大 :i: 二 i 
一 1; 直 到 i 二 1. 在 每 次 操作 时 , 可 能 要 对 结 点 的 位 置 进 行 调整 。 如果 
在 调整 过 程 中 ,使 下 一 层 已 建成 堆 的 子 树 不 再 满足 堆 的 定义 , 则 要 继 
续 进 行 调整 。 这 种 调整 可 能 会 一 直 延 伸 到 树叶 。 这 种 方法 好 象 一 层 
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一 屋 地 过 第 ,每 第 一 次 就 将 较 小 关键 字 往 树 根 方向 移动 一 次 。 图 10-9 
以 完全 二 叉 树 形式 给 出 了 建 堆 的 示例 。 其 中 ,初始 关键 字 序 列 为 {46， 
55,13,42,94,17,05,70) 。 


从 编号 i 一 [ 二 ] 一 4 
的 结 点 开始 
42<<70 不 移动 


46>5 且 46>13 
46 沿 右 支 得 下 


(e) 建成 的 堆 


图 10-9 建 初始 堆 过 程 示例 
描述 筛选 算法 的 框图 如 图 10-10 所 示 。 在 调用 筛选 算法 时 ， 应 
给 出 第 选 的 范围 [s. .tj 以 及 存储 记录 的 向 量 r。 
其 PASCAL 语言 描述 如 下 ，; 
PROCEDURE heap(VAR r:sre; s,t:integer); 
VAR 
1,]:integer; 
XxX:node; 
BEGIN 
i: 一 S; 
] :一 2xi; 


X: =r|i|; 


* 215。 


从 第 i 一 s 个 结 点 开始 筛选 : 
取出 第 位置 的 记录 过 X 


沿 右 分 支 筛选 ,使 ] 指 
向 结 点 i 的 右 孩子 


沿 左 分 支 筛 选 , 使 j 指 
问 结 点 ! 的 左 孩 子 


X 的 关键 字 :rtjj] 的 关键 字 


> 


将 关键 字 小 的 记录 交换 到 i 位 置 


向 下 一 层 进 行 比较 ,使 i: =] 


< 


将 记录 X 送 到 i 位 置 


10-10 筛选 算法 框图 
WHILE j=t DO 
BEGIN 
IF (0<t) AND (Cr[j}. key>r[j+1]. key) 
THEN ] : = 二] 十 1; 
IF x. key>r[j]. key 
THEN 
BEGIN 
r[i]:=r[jj]; 
1: 一 ]; 
j: =2x1; 
END 
ELSE j: 王 t 十 1 
END; 
(WHILE， 
r[i]:=x 
END; 
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{heap) 
初始 堆 建成 后 ,输出 堆 顶 元 素 , 将 最 末 一 个 结 点 移 到 堆 顶 位 置 ; 
然后 重新 建 堆 , 再 输出 ,再 移动 ,如 此 反复 执行 ,直到 输出 全 部 记录 为 
止 。 这 样 就 得 到 了 一 个 记录 按 关 键 字 的 有 序 序 到 ,从 而 完成 了 堆 排 
序 。 以 图 10-9 中 的 堆 为 例 , 在 图 10-11 中 给 出 了 堆 排 序 的 执行 过 程 。 
描述 堆 排序 算法 的 框图 如 图 10-12 所 示 。 
堆 排序 算法 的 PASCAL 语言 描述 如 下 : 
PROCEDURE heapsort (VAR r:sre; niinteger); 
VAR 
temp :node ; 
1] ,k :integer; 
BEGIN 
FOR 1:;=n DIV 2 DOWNTO 1 DO heap(r,iny》 
FOR k:=n DOWNTO 2 DO 


BEGIN 
write(r[ 1 |. data :4); 
temp :一 rL1]; 
r[1]:=r[Lkj; 
r[k|:=temp; 
heap(lr,1,k—1); 
END:; 
writeln(r[1]. data ;4); 
上 END ; 
{heapsort) 


堆 排 序 对 人 少量 的 记录 来 说 ,其 优越 性 并 不 明显 ,但 对 大 量 的 记录 
来 说 是 很 有 效 的 。 

经 分 析 可 以 得 出 堆 排序 在 最 坏 情 况 下 ,其 总 的 计算 时 间 为 
Onljogsn)。 相 对 于 快速 排序 来 说 ,这 是 堆 排序 的 最 大 优点 。 另 外 , 堆 
排序 仅 需 一 个 供 交换 时 和 暂 存 记录 的 辅助 空间 。 它 是 一 种 不 稳定 的 排 
序 方 法 。 
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重建 堆 9 输出 70 SS 输出 94 
my 移动 04 (9 和 排序 结束 


输出 序列 :5,13,17,42,46,55,70,94 


图 10-11 堆 排 序 示 例 
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以 1,n 为 参数 调用 和 饰 选 算法 


记录 数 n, 使 ] 为 Ln/2] 
下 


重新 建 堆 ; 以 |==1, 记 录 数 二 
k 一 1 调用 筛选 算法 


< 


10-12 堆 排 序 算法 框图 


10.4 归并 排序 


归并 排序 是 男 一 种 类 型 的 排序 方法 。 归 并 (merging) 的 意思 是 把 
两 个 或 两 个 以 上 的 有 序 序列 合并 起 来 ,形成 一 个 新 的 有 序 序列 。 开 始 
时 ,可 把 一 个 有 nm 个 记录 的 无 序 序列 看 成 为 n 个 只 一 个 记录 的 有 序 
子 序列 ,然后 进行 两 两 归并 ,最 后 形成 一 个 有 mn 个 记录 的 有 序 序 列 。 

例如 ,给 出 有 八 个 记录 的 某 序 列 , 其 关键 字 分 别 为 :46,55,13， 
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42,94,05,17,70。 归 并 时 , 先 把 这 个 序列 看 成 八 个 长 度 为 1 的 有 序 子 


[46] 155] [13] [42] [94] {05] [17] |70] 


上- 一 一 = Li——-” 上 一 一 下 上- 下 一 = 
[46 55] [13 42] [05 94] [17 70] 
L- -一 二 一 一 了 L 一 一 一 下 一 一 = 
[13 42 46 55] [05 17 70 94 ] 
| st 二 一 一 一 一 一 一 -J 
[05 13 17 42 46 55 70 94] 
开放 上 述 排序 方法 中 总 是 反 
ee z 复 将 两 个 有 序 序列 归并 成 一 
个 有 序 序 列 , 所 以 称 为 两 路 
递归 调用 ,对 ris..[ (st) 7 2]] 归并 排序 。 


进行 两 路 归并 排序 


上 述 例子 中 ,经 过 三 趟 
归并 完成 了 排序 。 第 一 趟 妇 
并 时 , 取 归 并 长 度 1=1( 即 子 
序列 中 的 记录 数 为 1 )。 在 一 
趟 归并 中 要 进行 多 次 的 两 两 
归并 ,分 别 使 长 度 为 1 的 首尾 
相连 的 二 个 子 序 列 归 并 为 一 
图 10-13 ”两 路 归并 排序 的 递归 算法 框图 个 有 序 序列 。 然 后 ,长 度 增加 
一 售 再 进行 第 二 趟 归并 。 依 


递归 调用 ,对 rl [Cs 十 t) 7 2 十 1..t 
进行 两 路 归并 排序 


调用 归并 过 程 ,把 前 面 产生 的 两 
个 有 序 序列 合并 成 一 个 有 序 序列 


次 类 推 , 直 至 排序 结束 。 
递归 形式 的 两 路 归并 排序 算法 的 框图 描述 如 图 10-13 所 示 。 此 

算法 实现 对 r[s. .tj 中 的 记录 进行 两 路 归并 排序 ,结果 使 rli[s. .tj 中 
记录 按 关键 字 有 序 ,其 中 用 到 了 一 个 辅助 向 量 r2Ls. .tj 用 于 暂 存 归 
并 过 程 中 的 记录 。 
这 个 算法 的 PASCAL 语言 描述 如 下 : 

PROCEDURE mergesort (VAR r'rl :listtype;s,t :integer); 

VAR . m:integer; 
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r2 :listtype; 
BEGIN 
IF s=t THEN rlls|]=rl[s] 
ELSE BEGIN 
m :一 (S 十 t) DIV 2; 
mergesort(r,r2,s,m); 
mergesort(r,r2,m 二 1,t); 
merge(r2,s,m,t,r]l); 
END 
END: 

在 两 路 归并 排序 算法 中 ,我 们 调用 了 一 个 两 两 归并 的 算法 
merge (rl,1,m,n,r2), 它 的 功能 就 是 将 在 rl 中 的 两 个 有 序 序 列 rl 
DL..mj 和 rlLm 十 1.. nj] 合并 成 一 个 有 序 序列 , 并 存放 在 r2L. .nj 中 。 
这 个 算法 的 框图 描述 如 图 10-14 所 示 。 

这 个 算法 的 PASCAL 语言 描述 如 下 ， 
PROCEDURE mergelrl :listtype;l, m,n:integer;VAR r2 :listtype); 
VAR 1,J,k,p:integer; 
BEGIN 
i: =:1;] :一 mm 十 1; k:=l; 
WHILE (<=m) AND (<=n) DO 
IF rl[il]. key<=rl[Lj]. key 
THEN BEGIN 
r2[k |]:=r1[ij; 
1: 二 1 十 ]; 
k :一 k 十 1 
END 
ELSE BEGIN 
r2[k |]:=r1i[j]; 
.Jl 
k : 一 K 十 1 
END:; 
FOR p:=i TO m DO 
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初始 化 三 个 指针 ijky 其 中 ij 用 于 
指示 两 个 有 序 序列 当前 所 取 的 记录 位 
置 ,上 用 于 指示 r ?中 存放 记录 的 位 置 


两 个 有 序 序 列 中 记录 都 没有 归并 完 吗 ? 


把 第 二 个 有 序 序 列 中 剩 
余 记 录 复 抄 到 7 ,中 


把 第 一 个 有 序 序列 中 剩 
余 记 录 复 抄 到 r ,中 


10-14 两 两 归并 算法 框图 
BEGIN 
r2[k]:=rl[pj; 
k:=k 十 1 
END:; 
FOR p:=] TOn DO 
BEGIN 
r2[k]:=rl[Lpj; 
k :一 k 十 1 
END 


END; 

两 路 归并 排序 总 的 时 间 复 杂 度 为 Olnlogzn) ,并且 需要 同 原 存储 
空间 大 小 相等 的 辅助 存储 空间 , 它 是 一 种 稳定 的 排序 方法 ,这 个 排序 
方法 也 可 用 于 外 部 排序 。 
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10.5 基数 排序 


基数 排序 Cradix sort) 的 设计 思想 与 以 前 的 各 种 排序 方法 均 不 相 
同 , 它 是 按 组 成 关键 字 各 位 的 值 进行 排序 的 。 

基数 排序 把 一 个 关键 字 K 看 成 一 个 d 元 组 , 即 :Ki,K,,*… ,Ka。 
其 中 ,0 二 二 K;<r, 这 里 的 + 称 为 基数 。 若 关键 字 是 十 进 制 的 整数 , 则 
r 二 10; 若 关 键 字 是 八进制 数 , 则 rf 二 8。d 表示 关键 字 的 位 数 ,此 位 数 
按 所 有 待 排序 的 关键 字 中 最 长 的 一 个 进行 计量 ,其 他 不 足 d 位 的 关 
键 字 则 在 前 面 补 零 。 

在 Ki, K,,.… ,ka 中 ,Ki 称 为 最 高 有 效 位 ,K， 称 为 次 高 有 效 位 ， 
Ks 称 为 最 低 有 效 位 。 基 数 排序 人 可 以 从 最 高 有 效 位 开始 ,出 可 以 从 
最 低 有 效 位 开始 。 现 在 仅 讨 论 从 最 低 有 效 位 开始 的 方法 。 

基数 排序 的 基本 思想 是 设立 r 个 队列 ,首先 按 关键 字 最 低 有 效 
位 的 值 , 把 n 个 记录 分 配 到 这 个 队列 中 ; 然后 将 各 队列 中 的 记录 
依次 收集 起 来 。 这 时 ,n 个 记录 已 经 按 关 键 字 最 低 有 效 位 的 值 从 小 到 
大 排 好 了 次 序 。 接 着 ,再 按 关 键 字 次 低 有 效 位 的 值 把 刚 收 集 起 来 的 记 
录 依 次 再 分 配 和 收集 ,直至 关键 字 的 最 高 有 效 位 。 这 样 就 得 到 了 一 个 
按 关 键 字 从 小 到 大 有 序 的 记录 序列 。 为 了 减少 记录 的 移动 次 数 ,队列 
采用 链 式 存储 结构 ,每 个 链表 (队列 )i 设 立 两 个 指针 ,一 个 指向 队 头 ， 
即 指向 第 一 个 进入 该 队列 的 记录 , 记 为 F[ij; 另 一 个 指针 指 问 队 尾 ， 
即 指 向 队列 中 刚 进入 的 记录 ,该 指针 记 作 E[ij。 现 举例 说 明 如 下 : 设 
有 8 个 记录 ,其 关键 字 分 别 为 179,208,306,093,859,984,271,033。 
它们 是 十 进 制 数 ,所 以 基数 r= 二 10, 关 键 字 的 位 数 4 二 3。 这 一 组 记录 
的 基数 排序 过 程 如 图 10-15 所 示 。 
图 10-16 为 基数 排序 算法 的 框图 描述 。 在 此 ,假设 存储 记录 的 链表 表 
头 为 head 以 及 基数 为 r, 组 成 关键 字 的 位 数 为 d。 
这 个 算法 的 PASCAL 语言 描述 如 下 : 

CONST 
maxd 一 {关键 字 的 位 数 最 大 值 }; 
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head 


(a) 初始 状态 
F[0] NIL ELo} 
F[1 ] E[1] 
F[2] NIL E[2] 
F[3] 93| ”1 33 | E[3] 
F[4] E[4] 
F[5] NIL E[5] 
F[6] E[6] 
E[7 ] 一 一 NIL E[7] 
F[8] E[8] 
F[9] 179| 二 (859| — E[9] 


(b) 第 一 次 按 最 低 有 效 位 分 配 后 各 队列 的 情况 
head 


271 | [93] 和 [33| 和 [884| 二 [306| 二 [208| el179| 


(c) 第 一 次 按 最 低 有 效 位 收集 后 的 情况 


F[o] 306| 十 一 [208| 一 一 ELO] 
FL ] 一 -一 一 NIL E[1] 
F[2] NIL E[2] 
F[3] E[3] 
FL[L4] NIL 一 一 一 EL4] 
F[5] ELS] 
F[6] 一 一 NIL EL6] 
F[7] 271| 二 79| | EL7] 
F[8] E[8] 
F[9] E[9] 


(d) 第 二 次 按 次 低 有 效 位 分 配 后 各 队列 的 情况 


radix 一 《基数 }; 
TYPE 
redlink = ‘ rednode; 
rednode = 二 RECORD 
key:ARRAY [1..maxd | OF 0. .radix 一 1; 
data :char; 


next :redlink ; 


“Ld 


head 


[5T 4 {E08[ 4 ~ [3 


head 


(e) 第 二 次 按 次 低 有 效 位 收集 后 的 情况 


Fio] Ero] 
Fl1] E[1] 
FL2] 208[ =|271| | EL2] 
F[3] E[3] 
F[4] NIL EL4] 
FL.5] NL E[5] 
F[6] NL 一 -一 -一 一 FE[6] 
F[7] NIL E[7] 
F[8] E[8] 
F[9] E[9] 


({》 第 三 次 按 最 高 有 效 位 分 配 后 各 队列 的 情况 


3T {51} [179T [308] +=[271[ [306T [859T 1 


(g) 第 三 次 按 最 高 有 效 位 收集 后 的 情况 


图 10-15 基数 排序 示例 
END; 


arrtp 一 ARRAY [0..radix—1] OF redlink; 
PROCEDURE vadixsort (VAR head :redlink ; r,d:integer); 
VAR k ,i,j:integer; 


be 


p'q:redlink; 


f,e:arrtp; 


“BEGIN 
FOR i:=d DOWNTO 1 DO 


BEGIN 


p: =head; 
head :一 NIL; 
] :一 0; 
REPEAT 
fr :一 nil; 
e[j]: =nil; 
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设立 搜索 指针 p; 从 表 头 head 
开始 搜索 ,使 p: 一 head 


组 织 循环 ,将 r 个 队列 的 头 、 
尾 指针 初始 化 , 即 赋值 为 NIL 


| 


进行 收集 操作 ,组 织 循环 ， 按 关键 字 第 i 位 的 值 K， 
对 非 空 队列 依次 进行 收集 ， 将 结 点 P 循 人 到 第 KK 个 
使 链接 成 一 个 新 的 链表 队列 中 


修改 P, 使 其 指向 下 一 个 结 点 


图 10-16 基数 排序 算法 框图 
]: 一 ] 十 1; 
UNTIL j=r; 
WHILE p=<>nil DO 
BEGIN 
:一 p 不 .key[i; 
IF f[k |]=nil 
THEN {lk|];=p 
ELSE elk | + .next :一 p; 
e[kj: 一 pi; 
p: 一 bD 人 .next; 
END; 
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REPEAT 
IF f[jj<>nil 
THEN 
BEGIN 
IF head<=<>nil 
THEN q 4 .next;=f[]j] 
ELSE head : =f[) |; 
q:=e[j] 
上 END; 
有 
UNTIL j=r; 
q+ .next :一 nil 
END 
END:; 
上 述 程序 中 ,f 和 分别 是 队列 的 首 、 尾 指针 ,r 为 基数 ,d 为 关键 
字 的 位 数 。 在 收集 操作 中 ,设立 了 一 个 指针 q, 它 总 是 指向 当前 新 形 
成 的 链表 的 最 后 一 个 结 点 。 设 立 q 指针 的 目的 是 为 了 能 够 快速 .方便 
地 将 每 一 个 非 空 队列 链接 到 当前 链表 的 后 面 。 值 得 一 提 的 是 在 分 配 、 
收集 操作 中 ,实际 上 并 没有 进行 记录 的 移动 ,而 仅仅 是 修改 有 关 的 指 
针 , 从 而 形成 按 关 键 字 最 低 几 位 的 数值 大 小 排序 的 链表 ，。 
分 析 上 述 算法 ,对 于 n 个 记录 ,执行 一 次 分 配 和 收集 的 时 间 为 O 
(n 十 r)。 如 采 关 键 字 有 d 位 , 则 要 执行 d 遍 。 所 以 总 的 计算 时 间 为 O 
(d(n 十 r))。 可 见 对 于 不 同 的 基数 r 所 用 的 时 间 是 不 同 的 。 当 r 或 d 
较 小 时 ,这 种 方法 较为 节省 时 间 。 基 数 排序 所 要 求 的 附加 存储 量 是 
个 队列 的 头 、. 尾 指针 , 即 为 2r 个 存储 单元 ;由 于 待 排序 记录 是 以 链表 
形式 存储 的 , 故 相 对 于 顺序 存储 结构 而 言 , 还 增加 了 n 个 指针 域 的 空 
间 。 
以 上 我 们 介绍 了 一 些 常 用 的 内 排序 方法 , 现 将 它们 的 优 缺 点 作 
一 简单 的 比较 。 
通常 从 以 下 两 个 方面 来 衡量 排序 方法 的 优 劣 : 
1. 排序 期 间 的 计算 工作 量 ,一 般 考 虑 关键 字 的 平均 比较 次 数 和 
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记录 的 平均 移动 次 数 。 

2. 排序 期 间 所 需 的 附加 存储 容量 。 

本 日 中 介绍 的 排序 方法 ,基本 上 可 以 分 为 两 大 部 分 。 一 部 分 是 简 
单 的 直接 算法 , 即 直接 插入 排序 ,直接 选择 , 冒 泡 排序 等 ; 另 一 部 分 
是 上 述 方 法 的 改进 ,如 希 尔 排 序 ,快速 排序 和 堆 排 序 等 。 直 接 算法 的 
计算 量 一 般 为 On ) ,而 它们 的 改进 算法 则 为 OCnlogsn7?。 但 这 些 佑 
算 都 是 很 粗略 的 ,而且 没 有 考虑 其 他 的 诸如 循环 控制 等 计算 量 。 所 
以 ,一些 研究 者 通过 实验 来 获得 较为 准确 的 计算 时 间 。 如 N. Wirth 
的 “算法 十 数据 结构 王 程序 ?一 书 以 及 D.E.Knuth 的 “计算 机 程序 设 
计 技 巧 ”( 第 三 卷 ) 中 都 给 出 了 实验 数据 ,目前 ,较为 一 致 的 结论 是 : 快 
速 排序 方法 最 快 , 其 次 是 归并 排序 , 堆 排 序 和 和 硕 尔 排序 。 当 待 排序 序 
列 的 记录 数 较 少 (如 记录 数 二 = 二 25) 时 ,直接 插入 排序 是 较为 有 效 和 
实用 的 。 

从 存储 容量 来 看 ,归并 排序 需要 的 附加 存储 量 最 大 ,对 n 个 记录 
需要 附加 一 倍 的 存储 量 .其 次 是 基数 排序 , 它 需 要 附加 较 多 的 存储 单 
元 用 于 存储 队列 指针 。 至 于 快速 排序 ,附加 的 存储 单元 是 用 于 调用 时 
存放 指针 的 栈 , 栈 的 大 小 取决 于 递归 的 般 套 浴 度 。 

总 的 来 说 ,每 种 排序 方法 都 有 它 本 身 特 殊 的 优点 ,所 以 有 实际 应 
用 中 ,由 于 应 用 场合 所 给 数据 结构 的 不 同 , 很 难 确定 哪 一 种 方法 是 最 
好 的 。 因 此 ,对 排序 方法 的 选择 要 因地制宜 。 


习 题 


1. 试 编写 在 链表 存储 结构 上 实现 插入 排序 和 选择 排序 的 算法 。 

2. 给 出 一 组 待 排序 的 记录 ,其 关键 字 为 : 12，2，16，30，8， 
28, 4，10，20,， 6，18。 写 出 用 下 列 方 法 进行 排序 时 ,每 一 趟 
排序 时 的 状态 : 
(1) 快速 排序 (2) 希 尔 排 序 (3) 堆 排 序 (4) 归并 排序 (5) 
基数 排序 

3. 判别 以 下 序列 是 否 为 堆 。 如 果 不 是 , 则 把 它 调整 为 堆 : 
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(1) (186, 86, 48, 73, 35, 39, 42, 57, 66, 21); 

(2) (18, 70, 33, 65, 24, 56, 48, 92, 86, 33); 

(3) (208, 167, 56, 38, 66, 23, 42, 12, 30, 52, 8, 20); 

(4) (6, 56, 20, 23, 40, 38, 29, 61, 35, 76, 28, 168), 

4. 已 知 (ki, k,,…, k,) 是 堆 , 试 编写 一 个 算法 将 (ki，k:,…， 
k,,k。+1) 调 整 为 堆 。 

5. 试 编写 折 半 插入 排序 算法 。 
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